ユーザログインナビゲーション |
コメントに返信レポートのコピペ量を測る毎朝6時に起きて早めに大学に行って仕事をするのが日課だが,今日はたまたま7時半過ぎまでNHKニュースを見ていたところ,キャスターが「コピペ」なる語の解説を始めた。大学生がネットからコピペしただけのレポートを書くので先生方が困っているという話。コピペレポートを提出することに大学生は罪悪感を感じていないとのこと。実際に大学生がカメラの前でやってみせていた。金沢工大の先生が作ったコピペ個所を見つけるソフトも紹介されていた。 コピペ量を調べる良いアルゴリズムはないだろうか。要はedit distanceの問題か。昔やったことのあるbinary diffを使ってもいい。Kolmogorov complexity(実際には圧縮ファイルサイズ)K(x),K(y),K(x+y)からx,yの距離を求めるという話もよくある。1文字ごとに改行して通常のdiffを使うという話もテキストマイニングの本で読んだことがある。1文字ずつでなくても,形態素ごとでもいいだろう。
返信 |
検索 |
最近のコメント
3日 21時間前
3日 21時間前
3日 21時間前
3日 23時間前
4日 8時間前
6日 13時間前
6日 16時間前
6日 17時間前
6日 17時間前
6日 19時間前