[-]=======================================================================[-] Wizard Bible vol.27 (2006,6,7) [-]=======================================================================[-] x0xXx0xx0xXx0xx0xXx0xx0xXx0xx0xXx0xx0xXx0xx0xXx0xx0xXx0xx0xXx0xx0xXx0xx0xXx0x x0xXx0xx0xXx0xx0xXx0xx0xXx0xx0xXx0xx0xXx0xx0xXx0xx0xXx0xx0xXx0xx0xXx0xx0xXx0x ---- 第0章:目次 --- x0xXx0xx0xXx0xx0xXx0xx0xXx0xx0xXx0xx0xXx0
日本語については朝日新聞・読売新聞の一面及び社説、アメリカ歴代大統領の就任演説(フィッツジェラルド~ジョージ・ブッシュ)の和訳、20代男性のE-mail及び刑法から11万7433字を解析したデータです。なおカッコ内の数字は出現回数です。解析方法は「漢字かな変換プログラムkakasi」 を使い漢字及びカタカナをひらがなに変換した上で、統計を取りました。 ローマ字頻度表(頻度順) ローマ字の統計は、仮名頻度表のデータをローマ字に換算して統計を出しました、換算の仕方は「ん」は「n」を1打鍵したものとし、小文字については「l」や「x」をつかわずに2重子音で入力したものとし、訓令式を元として入力されたものとしました(「しゅ」や「きょ」などの小文字の「ゃ」などは「y」を使って入力)。 但し小文字の「っ」については「つ」と入力したものとしました。ただし「づ」は「du」と入力されたものとしました。 また正
さて、この方法で、単語単位での解析結果から前述のような「板同士の類似度」を計算してみたところ、今度は感覚的に「精度が低い」結果が出ました。機械的に漢字のみを数え上げたものよりも高精度が出せると思っていたところだったのですが、内容の関連性のあまり見えない板が、「『総合』スレッドが多い」などといった関係で浮かび上がってくるのです。さらに、独特の用語や新しい固有名詞の使われているサンプルには、KAKASIの辞書をそのまま使うのは不適切であったという部分もあります。しかし、文字のみよりも形態素単位のほうが、解釈としては「本質的」に文章の「内容」に近づくという考え方は捨てきれません。何らかの補正をかけて、高精度を出すことは可能かもしれません。 個人レベルで利用できるツール ここまでは、自作ツールを用い、「2ちゃんねる」をサンプルとした解析結果 を紹介しましたが、次は、個人レベルで利用できる解析ツール
読者様より↓フィードバック や ご意見 ADOを使用してEUC-JPのファイルをShift_JISに変換する http://frog.raindrop.jp/knowledge/archives/000051.html ↑ここを見てEUCを勉強してね・・・と言われた。ADOを使った簡単な方法があるんですね・・・※先に↑を見てください(合わせて読んでください) 本文(発行内容) <文字コードで遊ぶ SJISからEUC ヤフオクURLでチェック> こんにちは、三流プログラマーのKen3です。 ヤフーオークションのURL パラメータの部分を作ってみます。 ※p=%XX%XX の 部分を使って(作って)みます。 いつもの三流的なアプローチなので、実際はアレンジして使ってください。 ※一部でも参考になればいいんだけど・・・ /* * 1.今回のキッカケ */ 隣のVBA系に来た質問なんだけど、 --
ここでは、Windows 95以降の歴代のWindowsでタスクバーとスタートメニューがどのように変化してきたか見てみましょう。 Windows 95(IE 4なし) 初期のWindows 95/NT4のタスクバーは、全部で6個のウィンドウからなるシンプルなものでした。次は、ウィンドウのクラス名と親子関係を表したものです。Shell_TrayWnd、Button、TrayNotifyWnd、TrayClockWClass、MSTaskSwWClassといったクラス名は、Windows XPの今も変わっていません。 TClockは、時計ウィンドウ(TrayClockWClass)をサブクラス化して時計を改造します。 Shell_TrayWnd タスクバー |- Button スタートボタン |- MSTaskSwWClass タスクスイッチ | +- SysTabControl32 タスクス
「植物の知性」を研究、フィレンツェ大学の植物神経生物学研究所 2007年11月 9日 サイエンス・テクノロジー コメント: トラックバック (0) Nicole Martinelli 2007年11月09日 「プラントイド」(plantoid)は、火星を探索するためのロボットだ。中心の「幹」と太陽熱利用の「葉」が動力と通信機能を供給しつつ、「根」の部分が地表を調査する。 Photo Credit:LINV イタリア、セストフィオレンティーノ発――Stefano Mancuso教授は、「植物派」であることは楽なことではないということを知っている。Mancuso教授は、世界で唯一の、植物の知性を探究する研究所を運営しているのだ。 イタリアのフィレンツェからおよそ11キロメートルの郊外に位置する国際植物神経生物学研究所(LINV)では、Mancuso教授と9名のチームが、植物が下等生物だという通
JR東日本は11月9日、盗難やスキミングしたクレジットカードの情報を悪用し、モバイルSuicaを不正に利用した被害が約1000万円あったことを明らかにした。 不正利用されたカードの枚数は合計65枚。最初の被害があったのは2006年12月で、2007年10月半ばまで続いた。不正利用分については、JR東日本が全額補償する。 なぜ不正利用が起きた? モバイルSuicaは、交通乗車券・電子マネーの「Suica」をおサイフケータイで利用できるサービス。モバイルSuica用アプリをおサイフケータイにダウンロードして登録(会員登録)することで利用できるようになる(別記事参照)。 モバイルSuica用アプリに、クレジットカード情報や、オンラインバンクの口座を登録しておくと、そこからチャージ(入金)ができる仕組み。サービス開始当初、モバイルSuicaへの入金は、JR東日本が発行するクレジットカード「VIEW
ウタゴエは11月8日、携帯向け鼻歌採点サイト“はなわざ”に楽曲リコメンド機能「はな★マッチ」を追加した。 はな★マッチは、ユーザーの声からその人のテーマソングをリコメンドする機能。自己紹介や今の気分、ドラマのセリフなど、ユーザーの声が吹き込まれた動画をメールで送信すると、はなワザの持つ楽曲データベースの中から、声にもっともマッチする楽曲を選んでユーザーのテーマソングとして紹介する。マッチングには同社が開発した波形認識技術が使われ、ユーザーの声に含まれる波形の特徴を抽出し、データベースと照合する。 また、はなワザ★グランプリの視聴用サンプルとして、ウタゴエはクリプトン・フューチャー・メディアの許諾を受け、「初音ミク」の鼻歌コンテンツを追加。ユーザーが作成した初音ミクの鼻歌を利用できる企画も検討中だという。 はなわざへのアクセスは http://hanawaza.jp/ から。 各キャリアの発
■ 「違法性が怖くてイノベーションができるか」? 著作権法と電波法の場合 明日は情報ネットワーク法学会の大会ということで今夜は新潟に来ている。 「違法性が怖くてイノベーションができるか」と誰か言ったか知らないが、著作権をめぐる昨今の議論を聞いていると、そんな声が聞こえてくるような気がする。つまり、著作権法を厳格に守るだけの遵法精神を固持していたら、このインターネットがもたらした新しい時代に技術革新など生まれない。世界から取り残されてしまう。法律の方が変わるべきなんだ……と。これが一般化して、「法的にグレーな領域に挑戦していかないと新しいことはできないよ」という考え方をしている人がいるかもしれない。 著作権法に対してのそれはまあわからなくもない。さすがに、業務上過失致死傷のリスクを自覚してまでイノベーションを求めようとは誰もしないだろうが、著作権くらいまあいいじゃないかと。では、電波法59条
Expired:掲載期限切れです この記事は,ロイター・ジャパンとの契約の掲載期限(30日間)を過ぎましたので本サーバから削除しました。 このページは20秒後にNews トップページに自動的に切り替わります。
Expired:掲載期限切れです この記事は,ロイター・ジャパンとの契約の掲載期限(30日間)を過ぎましたので本サーバから削除しました。 このページは20秒後にNews トップページに自動的に切り替わります。
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く