Code Archive Skip to content Google About Google Privacy Terms
日本語文字認識 - beta >> English page Since: Oct. 1, 2008 Updated: Jan 13, 2010 このサーバは OCRopusと NHocrを使って 文書画像中の日本語文字を認識します。 文字の周囲にゴミや罫線があると認識に失敗します。 横書きの印刷文字のみに対応しています。 認識精度はまだ低いので、ご了承ください。 機密・秘密の画像は絶対に送信しないでください。 (BMP, JPEG, PBM/PGM/PPM, およびそれらのgzipで圧縮されたファイルが読めます。) server spec | other OCR servers Powered by WeOCR, OCRopus, and NHocr. 日本語文字行認識 - beta このサーバは NHocrを使って 文字行画像中の日本語文字を認識します。 一行だけの文字列のイメージを
新しいサービス(といっても大層なものではない)を作ろうと思った時に、画像の中の文字列を読み取る仕組みが必要な事に気づいた。いわゆるOCRだ。 オープンソースのOCRはごく僅かだが存在する。今回はその中の有力なものを紹介しよう。 今回紹介するオープンソース・ソフトウェアはTesseract OCR、Googleが手がけるOCRエンジンだ。 Tesseract OCRは元々、HPが開発していたもので、それをGoogleが開発を引き継ぐ形でオープンソース化されたソフトウェアだ。英語圏のソフトウェアなので日本語の読み込みには対応していないが、性能自体は高い評価を受けている。 実際試してみた限りでは、変換率50%を越えているだろう。一段の文章であれば問題なく変換できるが、多段組になっている文章やグレースケール等はうまく解析することはできない。 GoogleはGoogle Book Searchなどで
Scanning OCR Software Latest release: March 2015 v5.4 Totally free OCR software for Microsoft Windows Import Directly from Twain scanners, PDF and popular image formats About FreeOCR FreeOCR is a free Optical Character Recognition Software for Windows and supports scanning from most Twain scanners and can also open most scanned PDF's and multi page Tiff images as well as popular image file formats
Zinnia: 機械学習ベースのポータブルなオンライン手書き文字認識エンジン [日本語][英語] Zinniaは機械学習アルゴリズム SVM を用いたポータブルで汎用的な オンライン手書き文字認識エンジンです。Zinniaは組み込みの容易さと汎用性を高めるために、 文字のレンダリング機能は持っていません。Zinniaは文字のストローク情報を座標の連続として受け取り、 確からしい順にスコア付きでN文字の認識結果を返すだけに機能を限定しています。 また、認識エンジンは完全に機械学習ベースであるために、文字のみならずユーザの任意のマウス・ペンストロークに対して任意の文字列をマッピングするような認識エンジンを小コスト作成することができます。 主な特徴 機械学習アルゴリズムSVMによる高い認識精度 ポータブルでコンパクトな設計 -- POSIX/Windows (C++ STLのみに依存) リエント
tomoe-0.6.0をリリースしました。 tomoe-0.5.xからの変更点: 簡体字中国語辞書の追加 (Red Hatの技術者の方々の成果です。ありがとうございました) 日本語辞書の拡張(JIX 0208 第2水準のサポート) ロケールに基づいてデフォルト辞書を自動選択 ただし、現在のところjaとzh_CNのみで、それ以外のロケールで使用すると辞書が有効にならず、またオンデマンドでの辞書の変更も実装されていません。起動時にロケールをセットするようにして下さい。 $ LANG=ja uim-tomoe-gtk $ LANG=ja scim-tomoe libtomoe-gtk を tomoe-gtk に名称変更 tomoe_gtk_init() と tomoe_gtk_quit() を追加 互換性確保のためにtomoe_gtk_window_new()で自動的にtomoe_gtk_i
tar(ター、tape archives)はファイルアーカイブのファイルフォーマットの一種である。このファイルフォーマットを処理する同名のUNIXコマンドtarも指す。UNIXでは圧縮したtar形式のファイルを"tarball"(ターボール)と呼ぶこともある。POSIX.1-1988[3]やPOSIX.1-2001[4]で規格化され、UNIX系オペレーティングシステムでは標準のフォーマットである。Windows では Windows 10 Build 17063 (Version 1803) 以降からコマンドラインツールが標準搭載されていて[5]、File Explorer では Windows 11 Build 23493[6] (Version 22H2[7]) 以降は解凍に対応していて、Windows 11 Build 25992[8] (Version 23H2予定[9])以降は圧
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く