コメントに返信

レポートのコピペ量を測る

毎朝6時に起きて早めに大学に行って仕事をするのが日課だが,今日はたまたま7時半過ぎまでNHKニュースを見ていたところ,キャスターが「コピペ」なる語の解説を始めた。大学生がネットからコピペしただけのレポートを書くので先生方が困っているという話。コピペレポートを提出することに大学生は罪悪感を感じていないとのこと。実際に大学生がカメラの前でやってみせていた。金沢工大の先生が作ったコピペ個所を見つけるソフトも紹介されていた。

コピペ量を調べる良いアルゴリズムはないだろうか。要はedit distanceの問題か。昔やったことのあるbinary diffを使ってもいい。Kolmogorov complexity(実際には圧縮ファイルサイズ)K(x),K(y),K(x+y)からx,yの距離を求めるという話もよくある。1文字ごとに改行して通常のdiffを使うという話もテキストマイニングの本で読んだことがある。1文字ずつでなくても,形態素ごとでもいいだろう。

返信

このフィールドの内容は非公開にされ、公表されることはありません。
  • 行と段落は自動的に折り返されます。
  • PHP コードを投稿することができます。 コードには <?php ?> タグを含めなければなりません。
  • ウェブページアドレスとメールアドレスは、自動的にハイパーリンクに変換されます。

書式オプションに関するさらに詳しい情報...