ユーザログインナビゲーション |
今日は変なことが起こるWord 2008を起動したらMacがカーネルパニック。アドエスで撮った写真がちょっとピンボケだがEmacs.appの上にメッセージが出ている。 Windowsでごみ箱を空にしたつもりがごみ箱のアイコンまで消えた。
レポートのコピペ量を測る毎朝6時に起きて早めに大学に行って仕事をするのが日課だが,今日はたまたま7時半過ぎまでNHKニュースを見ていたところ,キャスターが「コピペ」なる語の解説を始めた。大学生がネットからコピペしただけのレポートを書くので先生方が困っているという話。コピペレポートを提出することに大学生は罪悪感を感じていないとのこと。実際に大学生がカメラの前でやってみせていた。金沢工大の先生が作ったコピペ個所を見つけるソフトも紹介されていた。 コピペ量を調べる良いアルゴリズムはないだろうか。要はedit distanceの問題か。昔やったことのあるbinary diffを使ってもいい。Kolmogorov complexity(実際には圧縮ファイルサイズ)K(x),K(y),K(x+y)からx,yの距離を求めるという話もよくある。1文字ごとに改行して通常のdiffを使うという話もテキストマイニングの本で読んだことがある。1文字ずつでなくても,形態素ごとでもいいだろう。
帰ってきたIMSLP著作権問題で閉鎖されていたパブリックドメインの楽譜の宝庫 IMSLP が再開。さっそくいくつかダウンロード♪♫♬ 著作権切れの楽譜を持っておられるかたはぜひScanSnapに放り込んで,IMSLPにアップロードしてください。 1785-1985年のTimes紙を全文PDFにした Times Archive もすばらしい。宝庫がどんどん増える。
Gaming the Vote: Why Elections Aren't Fair (and What We Can Do About It)William Poundstone の How Would You Move Mount Fuji? という本を2003-05-05に購入,このブログでも紹介したことがある。その著者が Gaming the Vote: Why Elections Aren't Fair (and What We Can Do About It) というおもしろい本を出したので買ってみた。 これは 評価投票なら世の中が変わっていたかもしれない で紹介したArrowの定理を覆すというrange votingについての本である。Arrowの定理についても平易に解説している。裏表紙には何とKenneth J. Arrow本人による推薦の言葉:Gaming the Vote is a must-read for anyone interested in the process and outcomes of voting. Poundstone gives a clear and remarkably accurate account of the rich theoretical literature. His examples of voting anomalies in real elections are both lively and revealing.
ウィキペディアを磨こうNatureはかつてWikipediaとEncyclopaedia Britannicaを比較するために両者から種々の科学分野の記事を拾い出し,出所を伏せて専門家に査読を依頼した。その結果,それぞれ重大な誤りが4:4,些細な誤りが162:123見つかった。つまり,Wikipediaのほうが誤りが若干多いものの,オーダーとしては同じであった。Internet encyclopaedias go head to head, Nature 438, 900-901 (15 December 2005)[Natureの誌面にはJimmy WalesがPowerBookをかついでいる大きな写真が載っている]。これに対してBritannica側が反論し,さらにNatureが反論している。 これは英語版Wikipediaの話。今や項目数も243万を超えた。一方,ウィキペディア日本語版は2008年6月25日に50万項目を達成したばかりである。 ウィキペディア日本語版は,WikipediaのDeflateの項目が荒れているとそのコメントで書いたように,一部の専門的な項目が英語版よりかなりレベルが低い。誤りについては修正できたと思うが,まだ英語版に比べて内容が薄い。とりあえず英語版の翻訳でいいから,どなたか加筆していただければありがたい。 日本語版については,文章の質も英語版よりかなり低いように思う。かつては JF 文書文体ガイド というものがあってLinux関係の文書の文体を整える規範となっていたが,ウィキペディアにスタイルガイドはあるのだろうか。とりあえず常体(「である」調)で書いて,「、。」で統一するというくらいだろうか。括弧は全角()だろうか半角()だろうか[日本語の文脈では全角が好ましい]。 まずは歴史的な当て字風の表記はやめよう。上のJFの文体ガイドにもあるが,「又は」は「または」,「〜の為」は「〜のため」,「出来る」は「できる」などなど,ちょっと注意すればかっこよくなるところがたくさんある。 また,ちゃんと出典を挙げよう。
WikipediaのDeflateの項目が荒れているある依頼がきっかけでWikipediaの日本語の Deflate の項目を見て,びっくりした。冒頭の「Deflate(デフレート)はP. Deutsch氏とAladdin Enterprisesによって開発された」からして出鱈目である。正しくは英語版 DEFLATE にあるようにPhil Katz(のところの技術者)が(日本での成果を参考にして)考えたものである。Ghostscriptで有名なL. Peter DeutschはDeflateの仕様をまとめたRFC1951の著者である。 「LZHアルゴリズム(LZSSのポインタのみをハフマンで圧縮するもので、Brentが考案した)とほぼ同じアルゴリズムを使う」云々は,参考文献が挙げられていないが多分 R. P. Brent (1986) A linear algorithm for data compression のSLHアルゴリズムのことだろうが,SLHは「LZSSのポインタのみをハフマンで圧縮する」のではなく,ポインタも文字も混ぜて9ビットごとに区切ってHuffman符号化する。この論文はLHA開発中にROM男さんに送っていただいたものを読んでPC-VANに要約をアップロードしたのでよく覚えている。 Gzipが「シャノン符号」を使うというのも出鱈目だし,最後の「現在はこのDeflateの2倍以上効率が良いアルゴリズムが生まれ始めている」というのも,効率って何のことかよくわからない。 どうしよう。この週末で全部書き直そうか。どなたか開発者じゃない中立な立場の方にやっていただければいいのだが。
エル・ネットエル・ネットのインターネット配信を初めて見た。コンテンツはまだあまり多くないが,「デジタル映像制作者への扉コース」(Flashムービー)はおもしろそう。
評価投票なら世の中が変わっていたかもしれない電子投票について書いた2ページ以降は見ないにいろいろ貴重なコメントをいただいた。 考えているうちに,昔書いたメジアンを使おうの後半部分を思い出した。これは朝日新聞2007-06-12の「脱・1人1票」という記事の紹介で,投票で一人を選ぶのではなく,各候補者に評点を付けてそのメジアンが最大の候補を選ぶというものである。朝日のデータベース「聞蔵II」のPDFでは肝心の図表が白塗りされているが,BalinskiとLarakiのサイト vote expérimental に朝日新聞のスキャン(PDF)も置いてある。彼らの方法(“majority judgement”)の数学的な解説はPNASの A theory of measuring, electing, and ranking という論文に詳しい。候補者の順序関係ではなく評点を用いることによってArrowの定理などで示される投票の限界を超えることができるというものだ。実際の選挙で本物の投票と並行して実証実験を行った結果が朝日新聞や上記vote expérimentalページに載っている。 同様の方法がRangeVoting.orgで唱えられている。こちらはメジアンではなく平均値を使う方法だが,代表値としてはtrimmed meanを含めいろいろ考えられそうだ。同サイトにはメジアンに対する批判も書いてある。ただ,BalinskiとLarakiは,単なる6点スケールではなく Très Bien, Bien, Assez Bien, Passable, Insuffisant, A Rejeter という具体的な評価値を用いる点が重要としているので,この批判は当てはまらないかもしれない。 こういった複雑な投票は紙ではたいへん煩雑になるが,電子投票なら簡単にできる。実際,AmazonやYouTubeなどで星の数で評価をすることにネチズンたちは慣れている。 BalinskiとLarakiの実験でも示されたように,評価による投票は選挙結果を大幅に変える可能性がある。特にラルフ・ネイダーのようなspoiler(であるかどうかは議論があるが)の影響を受けにくいのでゴアがブッシュに勝っていた可能性があり,イラク戦争は起こらず温暖化対策も進んでいたかもしれない。 [追記] vote expérimental の表をCSVにしたもの: ,Excellent,Very Good,Good,Acceptable,Poor,To Reject,No Grade Bayrou,13.6%,30.7%,25.1%,14.8%,8.4%,4.5%,2.9% Royal,16.7%,22.7%,19.1%,16.8%,12.2%,10.8%,1.8% Sarkozy,19.1%,19.8%,14.3%,11.5%,7.1%,26.5%,1.7% Voynet,2.9%,9.3%,17.5%,23.7%,26.1%,16.2%,4.3% Besancenot,4.1%,9.9%,16.3%,16.0%,22.6%,27.9%,3.2% Buffet,2.5%,7.6%,12.5%,20.6%,26.4%,26.1%,4.3% Bové,1.5%,6.0%,11.4%,16.0%,25.7%,35.3%,4.2% Laguiller,2.1%,5.3%,10.2%,16.6%,25.9%,34.8%,5.3% Nihous,0.3%,1.8%,5.3%,11.0%,26.7%,47.8%,7.2% Villiers,2.4%,6.4%,8.7%,11.3%,15.8%,51.2%,4.3% Schivardi,0.5%,1.0%,3.9%,9.5%,24.9%,54.6%,5.8% Le Pen,3.0%,4.6%,6.2%,6.5%,5.4%,71.7%,2.7% これをExcelに読み込ませ,評価を数値5, 4, 3, 2, 1, 0に換算してrange votingのように平均点を求めてみれば,最後の4候補の順位が少し変わり,最低はLe PenではなくSchivardiになる。
「デジタルカルチャー日本」展示会三重県文化会館で「デジタルカルチャー日本」展示会を見てきた。実際にEPSON PX-7500Nなどの顔料タイプの大判インクジェットプリンタで浮世絵を出力するところを見せてもらった。フレスコグラフィックスペーパー(Fresco Graphics Paper)というざらざらの紙がなかなかおもしろい。炭酸カルシウムを主体とした荒めの粒子を裏打ち紙に接着して水性インクジェットプリンタ用に表面処理したもので,A4で300円くらいとのこと。ARTS & CRAFTS GALLERYにこの展示の紹介とポスター(PDF)がある。A&C GRAPHICS PAPERがこれに相当するようだ。名刺をいただいたのは株式会社北辰の萬本さんだが,ここがA&Cの運営会社のようだ。 [2008-06-24追記] フレスコグラフィックスペーパーに印字されたものをScanSnap+キャリアシートで読み取ろうとしたのだが,エラーになって読み取れない。
2ページ以降は見ない電子投票:「2頁以降不利」 提案の自民議員反対で廃案に(毎日):「2ページ以降の候補者は有権者が見ないから落ちますよ」。電子投票がよいかどうかはともかくとして,この自民議員の反対理由に関しては,1ページに収まらない場合は,最初のページは50音で氏名の1文字目を選ぶのでは駄目だろうか。 1ページに収まる場合も,毎回並び順をランダムにしてもいいかもしれない。某所の投票では被選挙人氏名コード表の並び順は1枚1枚ランダマイズされている。どなたかがTeXでプログラムしてくださっているようだ。
|
Google Search |
最近のコメント
1日 7時間前
1日 9時間前
1日 15時間前
1日 15時間前
1日 15時間前
1日 16時間前
1日 16時間前
1日 18時間前
1日 22時間前
1日 22時間前