カレンダー

07月 │2017年08月│ 09月
- - 1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30 31 - -

 プロフィール

はしもと

Author:はしもと
ユーザインタフェース系のお仕事をしてます.関心領域は画像処理,拡張現実感,ヒューマンコンピュータインタラクション,エンタテインメントコンピューティングあたり.モノ書きもやってます.

 工学ナビ

工学ナビは工学系の技術のチュートリアルを扱うサイトです.

 作ったもの

 Twitter

 

 天気予報


 ブログ内検索

 カテゴリー

最新コメント

 RSSフィード

 リンク

このブログをリンクに追加する




工学ナビの中の人 はしもとのブログです. いろんなコトを研究的,工学的な視点で見つめます.
スポンサーサイト
上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

目的のためなら手段を選ばない
060512.jpg 後輩が,文字コピペ禁止プロテクトの入ったPDFファイルをどうにかしてコピペできないかと尋ねてきたので

「紙媒体に一回印刷してOCRソフトでスキャンしたらいいんじゃね?」

とアドバイス。しかしその後で,OCRソフトは普通にJPEGとかBMPからでも文字スキャンできるということを知る。OCRってたいていスキャナに付属してるものだから,スキャナを介す必要があると勝手に思い込んでいたけど,考えてみれば至極当然じゃないか!(バカ)

つまり,

 PDF→スクリーンショット撮る→JPEG→OCR→テキスト→(゚Д゚)ウマー

ということですね。

で,フリーのOCRソフトを探してみたら,「SmartOCR Lite Edition」というのが好評らしく,いざ落としに行ってみればちょうど先月付けで会社が業務終了しているという罠。しかも再配布するなと釘をさされてる始末。

仕方ないので別のフリーのOCRを探してみたら「やさしくPDF OCR(体験版)」というのがありました。体験版にしてはまずまずの使い心地だったので,これにて一件落着。


この記事に対するコメント
なぜ魅惑のスイーツが写真で…
手抜きは発見の母ってね!
いや,違いますけど….
まぁ,無駄な努力するより道具を使って上手くやっていこうということですね.
【2006/05/12 22:18】 URL | hiro #Hj1FNbYI [ 編集]


>hiroさん
「手抜きは発見の母」というより,この場合,ただの悪ヂエですけどねw
あと魅惑のスイーツはおいしく頂きました(周囲に見せびらかしながら)
【2006/05/12 22:55】 URL | なおき #F54KmX5Y [ 編集]


TA・・・あるあ・・ねー・・・あるあるあるあるorz...
僕んとこの教授の実験のTAだからもうねorz...実験進みませんよ・・・
掛け算や引き算はまともにできてくれよ、と。
救いは時給が2000円ちょっと無いくらいでしょうか

OCR便利ですよね。入力しないでいいのがうれしい。
【2006/05/13 00:22】 URL | 警備員 #FCbMmv32 [ 編集]


>警備員さん
>救いは時給が2000円ちょっと無いくらいでしょうか
ちょっ え? なにぃぃぃぃー!? うらやましい限りです。
にしても実験TAはどこも鬼門のようですね。コワイコワイ

OCRはあれで「文字認識の製品」として十分な域に達してますから
もうこれ以上文字認識の研究ってネタあるのかな,って思っちゃいます。
【2006/05/13 00:47】 URL | なおき #F54KmX5Y [ 編集]




この記事に対するコメントの投稿














管理者にだけ表示を許可する


この記事に対するトラックバック
トラックバックURL
→http://kougaku.blog28.fc2.com/tb.php/146-7d53bebe
この記事にトラックバックする(FC2ブログユーザー)

上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。