5ちゃんねる ★スマホ版★ ■掲示板に戻る■ 全部 1- 最新50  

■ このスレッドは過去ログ倉庫に格納されています

[OCR] 画像→テキスト化総合

1 :名無しさん@お腹いっぱい。:2006/03/06(月) 18:04:38 ID:eFU2jlRP0
読んde!!ココ・読取革命・e.Typist・OmniPage・OmCR(オムロン)・CROSS OCR・本格読取・表OCRなどなど・・・
最近SmartOCRなんてフリーソフトも出てきたけど、やっぱり読んde!!ココか、読取革命だよな。

2 :名無しさん@お腹いっぱい。:2006/03/06(月) 18:45:20 ID:6gc6RBbJ0
厨房が立てたスレ

3 :名無しさん@お腹いっぱい。:2006/03/07(火) 15:40:32 ID:skeQoj8u0
読んde!!ココって認識完了後アクセス違反とか出て落ちるんだけど
まぁ俺だけだろうな。

4 :名無しさん@お腹いっぱい。:2006/03/10(金) 21:26:35 ID:lHDi9coD0
読んde!!ココと読取革命はどっちがいいの?


5 :鴻Uク:2006/03/10(金) 21:29:44 ID:S0R8zV8a0
あのー僕PC暦短いので色々分からない事があるので聞きます。どうすれば画像をきれいにできるんですか?
僕がやると変な風になって汚いんです・・・・・友達とおんな自画像をやってもなってしまうんです。
どうすればきれいに出来るんですか?教えてください。よろしくお願いします。


6 :鴻Uク:2006/03/10(金) 21:33:30 ID:S0R8zV8a0
ここいないんですかね?

7 :名無しさん@お腹いっぱい。:2006/03/10(金) 21:42:35 ID:Tf3El4Fx0
クソガキは半年ROMってろ

8 :名無しさん@お腹いっぱい。:2006/03/10(金) 21:44:51 ID:Paw+6Rc70
たった半年でいいのか?

9 :名無しさん@お腹いっぱい。:2006/03/12(日) 20:02:44 ID:J0vozuT70
>8
まだ半年たってねーぞ

10 :名無しさん@お腹いっぱい。:2006/03/14(火) 16:21:51 ID:b6zmMMEN0
変換精度はどれがいい?
俺的には読んでココは日本語と英語が別々に変換できていい感じなんだけど。


11 :名無しさん@お腹いっぱい。:2006/03/17(金) 13:43:55 ID:gO9In4iM0
得手不得手があるからどれが良いかわからんね

なかなか使えそう
・読んde!!ココ
・読取革命
・SmartOCR

うまく使えなかった
・e.Typist

SmartOCRでいいや


12 :名無しさん@お腹いっぱい。:2006/03/18(土) 00:33:45 ID:0ZJSmInQ0
読み取り革命って英日を別にできたっけ?

13 :名無しさん@お腹いっぱい。:2006/03/31(金) 19:40:27 ID:HjKUXNSP0
11の4製品を試したことあるけど、
一番良かったのがe.Typist、僅差で読取革命、ちょっと落ちて読んde!!ココ
、一番悪かったのがSmartOCRだった

校正の手間を考えるとe.Typistがいいよ

14 :名無しさん@お腹いっぱい。:2006/03/31(金) 20:18:07 ID:PRDoRX/t0
e.Typistは使いにくいことで有名だけどな。
英文と和文が明確に分かれてるときは読んde!!ココを使う。

15 :名無しさん@お腹いっぱい。:2006/04/06(木) 16:12:32 ID:pxM0KovP0
一発!OCR PRO4っての使ってる
これはいいソフトなのか悪いソフトなのかわからん

16 :名無しさん@お腹いっぱい。:2006/04/10(月) 06:57:57 ID:ANgqWY9C0
>14
私は e.Typist が使いやすいです。最初に連続スキャンできるとことか
画像編集と認識枠編集がプルダウンでできる点など。

17 :名無しさん@お腹いっぱい。:2006/04/12(水) 21:42:31 ID:AxEbMcVI0
e.Typist対読んde!!ココ
e.Typistは、ちょっと前のバージョンから
認識できない所が画像のかけらとなって残るので
使いにくいと思うようになりました。
OCRとは直接関係ないですが、
スキャナで読んでPDFに変換すると
なぜか読んde!!ココの方が画像がきれいです。
容量も大きいですが。
PDFを開く場合、読んde!!ココは300dpi
e.Typistは400dpiにできてページ指定もできるので
e.Typistの方がいいです。

18 :名無しさん@お腹いっぱい。:2006/04/14(金) 23:37:06 ID:N8mNJIyF0
OCRを使ってますか?
http://pc8.2ch.net/test/read.cgi/bsoft/1141402809/


19 :名無しさん@お腹いっぱい。:2006/04/26(水) 09:26:07 ID:FsvYB+jHP
http://www.smartread.biz/
スマートリーディングでは、このたび、資金繰り悪化等の理由により、
業務継続が困難な状況となりました。つきましては、SmartOCR Lite
Edition の配布及び、SmartOCR Professional Edition 及び
SmartOCR Library SDK の販売を終了し、残務整理がつき次第、
スマートリーディングは解散させていただきます。

フリーの日本語OCRソフト「SmartOCR Lite Edition」の制作・配布が終了
http://www.forest.impress.co.jp/article/2006/04/25/smartreading.html
独自エンジンを搭載したフリーの日本語OCRソフト「SmartOCR Lite Edition」
http://www.forest.impress.co.jp/article/2005/11/29/smartocrlite.html


20 :名無しさん@お腹いっぱい。:2006/04/26(水) 09:36:38 ID:m0FjrqBt0
>>19
これ使ってた人いる?どうだったか教えて。

21 :名無しさん@お腹いっぱい。:2006/04/26(水) 09:38:35 ID:obU19Egq0
無くなると使ってみたくなるなw
誰か持ってないのか。

22 :名無しさん@お腹いっぱい。:2006/04/26(水) 09:41:57 ID:lKn05zZA0
>>19
資金繰り悪化なのか
最後にソースネクストから出したらいいのに

23 :名無しさん@お腹いっぱい。:2006/04/26(水) 09:42:58 ID:lKn05zZA0
>>19
てかベクターから落とせるわ

24 :名無しさん@お腹いっぱい。:2006/04/26(水) 09:47:09 ID:lKn05zZA0
>>19
使ってみたけど、フリーならこれ最強じゃん
てか、スキャナ付属のOCRソフトしか使ったことないけど、
画像開いてOCRできるソフトって初めて見た
著作権保護の関係か何かでできなくしてるのかと思ってたんだが

25 :名無しさん@お腹いっぱい。:2006/04/26(水) 09:50:31 ID:d6DMSpnf0
お、ほんとだ。ベクターから行けるね。
ファイルサイズ結構小さいなこれ。

26 :名無しさん@お腹いっぱい。:2006/04/26(水) 10:19:02 ID:nxvkFG+F0
配布終了してから人気が出るパターンかしら

27 :名無しさん@お腹いっぱい。:2006/04/26(水) 10:34:38 ID:s6JZv17G0
オンラインヘルプ消えた!?と思ったらgoogleさんが保存しておいてくれたので
とりあえず落としておいた。

28 :名無しさん@お腹いっぱい。:2006/04/26(水) 10:53:49 ID:lKn05zZA0
>>27
これか
ttp://www.google.co.jp/search?q=+site:www.smartread.biz+SmartOCR+%E3%82%AA%E3%83%B3%E3%83%A9%E3%82%A4%E3%83%B3%E3%83%98%E3%83%AB%E3%83%97&hl=ja&lr=lang_ja&filter=0

29 :名無しさん@お腹いっぱい。:2006/04/26(水) 10:56:29 ID:lKn05zZA0
あれ?Helpトップ以外は生きてんのか?

30 :名無しさん@お腹いっぱい。:2006/04/26(水) 11:00:13 ID:whFC2dmm0
フリーで使えるOCRがあるなんて初めて知ったぞ。
宣伝が足りんかったんじゃないか?
惜しいな。

31 :名無しさん@お腹いっぱい。:2006/04/26(水) 15:39:43 ID:5bt7kXOn0
わけあってWinからMacに移行したんだけど
Macで使えるフリーのOCR知りませんか?

今までWinでは、スキャナにバンドルされたe.Typist使ってました。
Mac用に新しくスキャナ買う方が早いとは思いますが
なるべく出費を減らしたいので…

32 :名無しさん@お腹いっぱい。:2006/04/26(水) 17:48:01 ID:lKn05zZA0
>>31
フリーのOCR自体今まで知られてなかったわけで・・・

33 :31:2006/04/26(水) 22:49:16 ID:mGh+oZ/Q0
e.Typistの体験版for macを発見したのですが
これって無料ですかね…
使用期限とか決まっているんでしょうか?
使っている方いらっしゃいません?

34 :名無しさん@お腹いっぱい。:2006/04/26(水) 22:57:14 ID:ZHlKHOIX0
>>33
おまえさんの見つけたページには書いてなかったのかね
>製品の機能を体験版(無料)でお試しいただけます。
>体験版は14日間使用できます。

35 :31:2006/04/26(水) 23:35:12 ID:mGh+oZ/Q0
すんません。節穴でした。

36 :名無しさん@お腹いっぱい。:2006/04/27(木) 13:33:19 ID:iRjK7qVK0
vectorからsmart OCR消えてない?
ほしいよー

37 :名無しさん@お腹いっぱい。:2006/04/27(木) 18:12:13 ID:1L9jLPzL0
うpうp(´・ω・`)

38 :名無しさん@お腹いっぱい。:2006/04/27(木) 23:02:49 ID:0DQdhPY20
http://upupupup.ddo.jp/uploader/2/index.cgi?mode=dl&file=1839
pass: 37のid

39 :名無しさん@お腹いっぱい。:2006/04/27(木) 23:15:51 ID:7d+55Bki0
横からd (・∀・)

40 :名無しさん@お腹いっぱい。:2006/04/27(木) 23:57:40 ID:iRjK7qVK0
>>38
dクス!

41 :名無しさん@お腹いっぱい。:2006/04/28(金) 16:07:15 ID:Qig/ZAM40
持っとき 持つとき
立っとき 立つとき
eTyistにはこういうミスがあるんですよね
フー

42 :名無しさん@お腹いっぱい。:2006/04/28(金) 23:24:00 ID:9HB9cKA10
eTyistなんていうtypoよりはかわいいと思う。
ちなみにそういう系統の間違いは読んdeの方がはるかにひどい。

43 :名無しさん@お腹いっぱい。:2006/04/29(土) 15:29:02 ID:1ZGgZvF60
>>38
もう落とせないよ。

44 :名無しさん@お腹いっぱい。:2006/04/29(土) 15:35:35 ID:YCQgrKfc0
>>38
落とせません
どうかお願いします…

45 :名無しさん@お腹いっぱい。:2006/04/29(土) 16:26:19 ID:roNR6MOZ0
>>38
再うpきぼんぬ

46 :名無しさん@お腹いっぱい。:2006/04/29(土) 18:23:22 ID:pJyegGMG0
>>27
オンラインヘルプのキャッシュは残っているけど、
保存するの面倒だね。
一枚づつ保存するしかないのかな?

47 :名無しさん@お腹いっぱい。:2006/04/29(土) 20:27:48 ID:f+6LR83n0
>>38
再うpお願いします。

48 :名無しさん@お腹いっぱい。:2006/04/29(土) 20:39:58 ID:MhA2Xxg/0
Axfc UpLoader Basic N13_2563に
pass=47のID

49 :名無しさん@お腹いっぱい。:2006/04/30(日) 02:14:57 ID:nWHTkHVQ0
>>48
いただきました。d。

50 :名無しさん@お腹いっぱい。:2006/04/30(日) 13:19:43 ID:sibMw9o50
>>48
ありがとーございます

51 :47:2006/04/30(日) 18:48:50 ID:DJadZW8h0
>>48
ありがとうございます。

52 :名無しさん@お腹いっぱい。:2006/04/30(日) 19:25:56 ID:sibMw9o50
>>51
お前タイ━━━━━━||Φ|(|゚|(ry

53 :名無しさん@お腹いっぱい。:2006/05/02(火) 10:55:53 ID:jmoTQzvi0
http://www.new-akiba.com/netrunner/0604/tools/toku1/SmartOCRLite106.zip

54 :名無しさん@お腹いっぱい。:2006/05/02(火) 11:39:44 ID:QHdWCCzm0
>>53
ネ申(>>48)からSmartOCRLite107.zipを手に入れた俺は勝ち組w
しっかし、流石ネトランだな

55 :名無しさん@お腹いっぱい。:2006/05/02(火) 15:34:29 ID:PIWI2VrP0
>>48
d。

56 :名無しさん@お腹いっぱい。:2006/05/02(火) 16:55:50 ID:n3Do9aaw0
SmartOCRLite107.zip本体と解説を載せたページを作ってみた。

http://www.450mb.com/users/freeocr/smartocr.html

著作権が怖いので、画像ファイルは利用しなかった。
でも、すぐにあぼーんされそうだな。
そしたらまた垢をとってアップしたいです。


57 :名無しさん@お腹いっぱい。:2006/05/02(火) 17:01:08 ID:g1yj7bnp0
http://pc8.2ch.net/test/read.cgi/bsoft/1141402809/103


58 :名無しさん@お腹いっぱい。:2006/05/02(火) 17:57:21 ID:s2ukK1zD0
つまり

OCR作っている会社の元社員がソース持ち逃げ→会社旗揚げ
こっそりやるつもりが評判になって目立ってしまい発覚
あぼーん

ってこと?

59 :名無しさん@お腹いっぱい。:2006/05/02(火) 17:57:28 ID:/YruOk2i0
てかおまいらどんな画像をテキスト化する必要があるんだ?

60 :名無しさん@お腹いっぱい。:2006/05/02(火) 18:18:25 ID:g1yj7bnp0
>>58 そう
>>59 ヒント:中高生にはわからない

61 :名無しさん@お腹いっぱい。:2006/05/02(火) 18:23:02 ID:KUqPvsT80
professionalはもう手に入らないかなぁ。。。

62 :名無しさん@お腹いっぱい。:2006/05/02(火) 20:28:04 ID:eySTO4Hw0
>>59
CDの歌詞。
CDDBに対応してない上に買う奴もほとんどいない古いCDで、
それでも中学時代の最高の思い出だったから、つい。

63 :名無しさん@お腹いっぱい。:2006/05/02(火) 20:56:38 ID:V+iUnJ/I0
>>56
(´・ω・`)ゝ 乙!

64 :名無しさん@お腹いっぱい。:2006/05/02(火) 23:09:44 ID:cyVDznGA0
>>56

106も載せて欲しいな

65 :名無しさん@お腹いっぱい。:2006/05/02(火) 23:17:04 ID:cyVDznGA0
>>56
というかむしろzipでくれ

66 :名無しさん@お腹いっぱい。:2006/05/03(水) 00:42:00 ID:xazCTYbE0
http://www.new-akiba.com/netrunner/0604/tools/toku1/SmartOCRLite106.zip
1.06はここ


67 :名無しさん@お腹いっぱい。:2006/05/03(水) 00:45:58 ID:KBjArdTC0
106と107ってそんなに違うのか?

68 :名無しさん@お腹いっぱい。:2006/05/03(水) 01:39:52 ID:v5VR/W2R0
>>56
zipでくれよー

69 :名無しさん@お腹いっぱい。:2006/05/03(水) 02:52:14 ID:xazCTYbE0
zipだろ
しかも固めてある.exeの解凍した奴を7zで圧縮すると、サイズが増えたり・・・

70 :名無しさん@お腹いっぱい。:2006/05/03(水) 05:08:11 ID:v5VR/W2R0
サイトをzipでくれって意味なんだが

71 :名無しさん@お腹いっぱい。:2006/05/03(水) 07:13:57 ID:Nf+FHH3j0
おはよ。

昨日>65は見ていたのだけれど、翌朝早く起きなければ
いけないために寝てしまいました。

要望のあったzipを下記のあぷろだにアップしました。
もし56のサイトやアップしたファイルをwebページなどで
紹介していただけるときには、できれば、smart ocrが配
布中止されたフリーウエアであるため、やむなく56のサ
イトやあぷろだで配布しているという旨の文を入れて
いただければうれしいです。

ttp://newsstation.info/up/img/ns8755.zip

72 :名無しさん@お腹いっぱい。:2006/05/03(水) 09:45:13 ID:G6oEUBhS0
てかこれ、倒産してるとはいえ、勝手に配布していいのか?

73 :名無しさん@お腹いっぱい。:2006/05/03(水) 10:01:16 ID:7yUtoGZ+0
某スレの粘着キタ━━━━━(゚∀゚)━━━━━!!!!

74 :名無しさん@お腹いっぱい。:2006/05/03(水) 10:19:38 ID:b7ZhKuyR0
>>72
お前の了承を得る必要だけはないな

倒産後に著作権うんぬんを吠える気力なんか残ってねーだろww

75 :名無しさん@お腹いっぱい。:2006/05/03(水) 10:26:20 ID:8E3E/k9j0
>>74
おまえもイタイやつだな

76 :名無しさん@お腹いっぱい。:2006/05/03(水) 11:51:54 ID:0lhYNr670
死人に口なしと同じ
典型的な犯罪者の論理

77 :名無しさん@お腹いっぱい。:2006/05/03(水) 12:04:53 ID:b7ZhKuyR0
何度もID変えて忙しいヤツだな
配布終了ソフトを持ってないヤツが手に入れるのが気にくわないのか?
皆が欲しがってる配布終了ソフトを自分が持ってることで優越感にでも浸りたいのか?
随分と心の狭い人だこと

78 :名無しさん@お腹いっぱい。:2006/05/03(水) 13:34:27 ID:xazCTYbE0
もともとパクリなのに、それがばれて尻尾巻いて逃げた奴が来襲してるんだろ。


79 :名無しさん@お腹いっぱい。:2006/05/03(水) 13:59:51 ID:JqYMH5uT0
そもそもOCRがフリーって時点で最初から不自然だ

80 :名無しさん@お腹いっぱい。:2006/05/03(水) 14:07:16 ID:xazCTYbE0
(AAのオートトレーサーは大体フリーだけどね)

81 :名無しさん@お腹いっぱい。:2006/05/03(水) 14:11:48 ID:JqYMH5uT0
失笑、どんだけ開発の手間違うと思ってんだかw

82 :名無しさん@お腹いっぱい。:2006/05/03(水) 14:13:35 ID:xazCTYbE0
あれってある意味辞書代じゃないの?


83 :名無しさん@お腹いっぱい。:2006/05/03(水) 15:38:46 ID:9PxSYckG0
>>79
Liteは体験版みたいなものだから

84 :名無しさん@お腹いっぱい。:2006/05/03(水) 16:56:09 ID:Mi9py0RC0
>>71
ありがとん。まじ助かる。

85 :名無しさん@お腹いっぱい。:2006/05/03(水) 17:01:56 ID:PlUOXP5Z0
Office2003がある人ならOCRソフトいらないんだけどな

86 :名無しさん@お腹いっぱい。:2006/05/03(水) 17:15:58 ID:hSKfr09h0
Officeにそんな機能あったのか。
クライアントから送られてくるWord&Excelファイル開くくらいしか
使ってないから知らなかったよ。

87 :名無しさん@お腹いっぱい。:2006/05/03(水) 17:34:52 ID:KsFm3eG/0
>>85
OfficeツールのMicrosoft Office Document Scanningのこと?
これって精度高いの?

88 :名無しさん@お腹いっぱい。:2006/05/03(水) 18:04:33 ID:PlUOXP5Z0
>>87
>これって精度高いの?
そのツッコミあると思った。
あんまり良くないみたいだけど、別途OCRソフトいらないって意味。
どっちみちフリーウェアで間に合わせようとか試してみるだけの人はOCRソフトを本気で使う気ない人だろうし

89 :名無しさん@お腹いっぱい。:2006/05/03(水) 18:17:02 ID:adN72Y2v0
スキャナーからしか読み取れないからだめぽ

90 :名無しさん@お腹いっぱい。:2006/05/03(水) 18:18:37 ID:PlUOXP5Z0
Microsoft Office Document Imaging

91 :65:2006/05/03(水) 18:36:57 ID:v5VR/W2R0
>>71
キタワァ*・゚ ゚・*:.。..。.:*・゜(n’∀’)η゚・*:.。. .。.:*・゜゚・* ミ☆

92 :名無しさん@お腹いっぱい。:2006/05/05(金) 02:03:01 ID:4HIO2pXo0
>>56氏のページをヘルプファイルにコンパイルしてみた。あんまり意味ないな。
よかったらどんぞ。適当にやったんで最初にトップページがこないですが(゚Д゚;)
ブラウザ立ち上げなくてもいいんで動作が軽くていいかな・・ぐらいで・・
ttp://read.kir.jp/file/read45732.zip

93 :名無しさん@お腹いっぱい。:2006/05/05(金) 03:37:33 ID:oAjwqDTG0
>>92


94 :56:2006/05/05(金) 08:00:50 ID:tgflGacC0
>>92
乙です。

Firefoxではページの表示がやや崩れてしまうのですが、
ヘルプファイルにするときれいに見えていいですね。



95 :名無しさん@お腹いっぱい。:2006/05/05(金) 15:42:30 ID:RvFFP/cy0
>>92
もう流れてるorz

96 :名無しさん@お腹いっぱい。:2006/05/05(金) 17:33:30 ID:gf23jBL/0
orz

97 :名無しさん@お腹いっぱい。:2006/05/05(金) 22:18:10 ID:4HIO2pXo0
ttp://read.kir.jp/file/read45800.zip

98 :名無しさん@お腹いっぱい。:2006/05/05(金) 22:26:19 ID:IEDfBYj20
>>97
  _n
 ( l    _、_
  \ \ ( <_,` )
   ヽ___ ̄ ̄  )   グッジョブ!!
     /    /

99 :名無しさん@お腹いっぱい。:2006/05/06(土) 01:19:05 ID:jz6gRgjH0
>>97
(・∀・) d !!

100 :名無しさん@お腹いっぱい。:2006/05/06(土) 03:24:16 ID:PetFtHox0
pc japan 5月号の付録CD−ROMのなかにSmartOCRLite107.zipはいってる。
もう、本屋には、並んでないかも。

101 :名無しさん@お腹いっぱい。:2006/05/06(土) 04:53:50 ID:rOrFwH6v0
>>100
五月号ってことは配布終了前?

102 :名無しさん@お腹いっぱい。:2006/05/06(土) 10:15:47 ID:y9goNNeE0
ここにあるぞ!
http://www.450mb.com/users/freeocr/smartocr.html

103 :名無しさん@お腹いっぱい。:2006/05/07(日) 03:29:39 ID:QvpPKyag0
どなたかヘルプファイルを…

104 :56:2006/05/07(日) 07:40:45 ID:28SofdyF0
おはよ。

SmartOCRのページを更新しました。
http://www.450mb.com/users/freeocr/smartocr.html

それに伴い、ページをzipで固めたものをアップしました。
ttp://newsstation.info/up/img/ns8904.zip

主な変更点は、
・「デジカメ画像の認識」の4つのページを追加 (ただし
 画像に関するタグ(IMG等)を削除)
・bullet028.gifを追加
 (ホームページビルダーの添付素材であることが判明
 したため)
・その他いろいろ
です。
今回のように大きな変更は、今後はない予定です。
ただし、鮪ペイントのときのように、作者さんから削除しろ
と言われれば削除すると思います。

105 :名無しさん@お腹いっぱい。:2006/05/07(日) 08:33:25 ID:3D/IHRxB0
>作者さんから削除しろ

それは・・・

106 :ゴルゴ:2006/05/07(日) 08:38:17 ID:QQJTGhLZ0
用があるならいつでも言いな

107 :名無しさん@お腹いっぱい。:2006/05/07(日) 10:45:22 ID:VAR4zsLs0
どっかにあんま流れないアプロダ無いかな。(゚Д゚;)
ttp://read.kir.jp/file/read45894.zip

56氏の変更に伴いこれも。目次もちょっと整理。

108 :名無しさん@お腹いっぱい。:2006/05/07(日) 11:52:37 ID:ZDZsclx/0
ここまでやって今更、画像が云々は
気にする必要がない気がする
画像が有る無しは関係ないでしょ。

109 :名無しさん@お腹いっぱい。:2006/05/08(月) 21:00:36 ID:uHRXZFEh0
紙の文書の透明テキスト付PDF化をしようと,読んdeココをかおうとしたら,
5000円程度でScanPaper for PDFという読んdeのサブセットっぽい製品を発見

しかし,両者体験版をダウンロードしてみて試したら,
全く同じ画像を認識させても読み取り結果が違う

もしかして同じエンジンを使っていないんでしょうか。

110 :名無しさん@お腹いっぱい。:2006/05/08(月) 23:09:11 ID:duKW9XQK0
>>109
公式に同じエンジンって書いてあるじゃん。

http://ai2you.com/ocr/news/sppdf/sppdf.asp
最新のOCR エンジン搭載!「透明テキスト付きPDF」の検索性がさらに向上 UP
「読んde!! ココ」で実績を誇る最新の「インテリジェントOCRエンジン」を搭載。

111 :名無しさん@お腹いっぱい。:2006/05/09(火) 08:40:19 ID:P7ir4+QG0
>>107
どっからDLできるのかわからん
流れにくいとこといえばuploader.tvだな

112 :名無しさん@お腹いっぱい。:2006/05/09(火) 14:58:03 ID:NFulwORs0
>>107
atwiki

113 :名無しさん@お腹いっぱい。:2006/05/09(火) 16:50:26 ID:YVoT0vx80
>>104
中の人です。
すみませんが、削除していただけないでしょうか?

114 :名無しさん@お腹いっぱい。:2006/05/09(火) 17:26:37 ID:NO/0pGw90
誰だよ

115 :名無しさん@お腹いっぱい。:2006/05/09(火) 20:21:47 ID:NFulwORs0
>>113
商用製品をパクる人に用はありません

116 :名無しさん@お腹いっぱい。:2006/05/09(火) 20:33:57 ID:20ZQP+8W0
>>113
本当に中の人なら、公式のページで再配布やめてくれって
ぐらいは表明すべきだと思う


117 :名無しさん@お腹いっぱい。:2006/05/10(水) 00:33:57 ID:Bda4VnD10
>>113
VerUP頼むわ

118 :名無しさん@お腹いっぱい。:2006/05/10(水) 21:44:08 ID:nAqb+2180
http://www.smartread.biz/

> SmartOCR Lite Edition 等を許可無く再配布しないよう、お願いいたします。

> 2006 年 5 月 10 日
> スマートリーディング


おしまい。

119 :名無しさん@お腹いっぱい。:2006/05/10(水) 22:07:21 ID:CY7nEEsl0
つか、フリーソフトは作者が何と言おうと配布自由だろw

120 :名無しさん@お腹いっぱい。:2006/05/10(水) 22:27:48 ID:xkfKvBky0
最近の子は
おもしろいな

121 :名無しさん@お腹いっぱい。:2006/05/10(水) 22:38:15 ID:+VNMwqgn0
商用製品をパクる>>>>>>>>>フリーソフトを再配布


公開するものに責任も取れないのに、さらに金を取ってたっていうんだからry

122 :名無しさん@お腹いっぱい。:2006/05/11(木) 01:03:34 ID:tO2R8dSA0
>>110
エンジンは一緒でも辞書は違うんだろうね。


123 :名無しさん@お腹いっぱい。:2006/05/11(木) 01:18:40 ID:L32mMQ+S0
>>119
タイ━━━━||Φ|(|´|Д|`|)|Φ||━━━━ホされますよ

124 :名無しさん@お腹いっぱい。:2006/05/11(木) 04:23:51 ID:EEVmh9Wi0
民事だろ。しかも親告罪。
訴えられて、裁判に負ければ賠償金。

125 :56:2006/05/11(木) 04:26:35 ID:jLp0dWRE0
とりあえずファイルへのリンクを削除しました。
オンラインヘルプのほうは、著作物として保護が
強く要請される(であろう)画像ファイルは使って
いないこと、また、既存ユーザーが利用するため
に必要な範囲の内容に限って掲載していることから、
そのまま存続させていただけるよう、お目こぼしを
お願いします。

では、名無しに戻ります。ノシ

126 :名無しさん@お腹いっぱい。:2006/05/11(木) 04:49:18 ID:EEVmh9Wi0
逃げたな・・
親に告げ口されるのがそんなに怖かったか

127 :名無しさん@お腹いっぱい。:2006/05/11(木) 06:31:28 ID:EEskzVF70
「所詮タダだろ」フリーウェアを家電店が勝手に販売
http://pc7.2ch.net/test/read.cgi/software/1077291400/

128 :名無しさん@お腹いっぱい。:2006/05/11(木) 08:39:28 ID:/aL4PfZT0
会社が消えたら配布し放題

129 :名無しさん@お腹いっぱい。:2006/05/11(木) 10:37:01 ID:LxxnFJOk0
>>124
キミは刑事と民事の区別が理解できていないな

130 :名無しさん@お腹いっぱい。:2006/05/11(木) 13:33:40 ID:agrsVXvc0
>>129
(゚д゚)

131 :名無しさん@お腹いっぱい。:2006/05/11(木) 15:53:16 ID:agrsVXvc0
>>125
リンク消しただけでディレクトリ丸見えじゃんw

132 :名無しさん@お腹いっぱい。:2006/05/12(金) 01:15:43 ID:j2y3fq7J0
こんな素晴らしい物があるなんてー

って思ったら配布停止?
あと1ヶ月早く知っていればー。

誰かタイムマシン貸してください。

upキボンヌ

133 :名無しさん@お腹いっぱい。:2006/05/12(金) 01:28:39 ID:/HxPhEPm0
>>132 お前はせめて1レス前を読解できんのかと

134 :131:2006/05/12(金) 02:00:01 ID:KhmKITRV0
>>133
もう消えてるよ
余計なこといったかな
まあネトランで拾っとけ

135 :名無しさん@お腹いっぱい。:2006/05/12(金) 06:21:39 ID:68bNEWFf0
まあ、海外の無料ホームページにうpするのは
足つかんし、無問題だろうけどなw

136 :名無しさん@お腹いっぱい。:2006/05/12(金) 10:59:41 ID:KhmKITRV0
だから56は海外の450mb.com作ったんでしょ

137 :名無しさん@お腹いっぱい。:2006/05/12(金) 18:52:25 ID:i4HhDkrH0
ネトランも消えた。

再配布を450mb.com限定で許可してほしい>中の人


138 :名無しさん@お腹いっぱい。:2006/05/12(金) 18:55:33 ID:H/Xkymqe0
実際活用してる奴いるの?

139 :名無しさん@お腹いっぱい。:2006/05/12(金) 19:06:03 ID:68bNEWFf0
海外サーバーなら消す必要無し

140 :名無しさん@お腹いっぱい。:2006/05/12(金) 21:37:12 ID:hpZFOLUr0
>>138
エロ小説のテキスト化に重宝しました

141 :名無しさん@お腹いっぱい。:2006/05/12(金) 21:48:03 ID:0jT5zqUc0
著作権法では、証拠物件として配布することは可能らしい。
(例:著作権侵害しているetc)

142 :名無しさん@お腹いっぱい。:2006/05/12(金) 23:13:05 ID:WLs6TdBZ0
>>137
俺がやる(`・ω・´)

143 :名無しさん@お腹いっぱい。:2006/05/12(金) 23:22:09 ID:ZB8yfhzw0
まあ個人使用で小説をテキストにして携帯するとかあるんじゃね
俺は今それに挑戦しようとしてる

144 :名無しさん@お腹いっぱい。:2006/05/12(金) 23:31:04 ID:XO1vz16L0
まだ>>48から落とせたりする事実

145 :名無しさん@お腹いっぱい。:2006/05/13(土) 01:45:51 ID:9Bw1SrP60
シェアウェアより認識率高いの?
それなら欲しいんだけど

146 :名無しさん@お腹いっぱい。:2006/05/13(土) 02:51:07 ID:Pli6zRPk0
読んでココでも買うとけ

147 :名無しさん@お腹いっぱい。:2006/05/13(土) 06:02:21 ID:jzE9OVGm0
文書OCR3.0を使ってましたが、SmartOCRの方が使えました。

148 :名無しさん@お腹いっぱい。:2006/05/13(土) 09:48:31 ID:375jvi9r0
>>144
どうみても消えています、本当にあり(ry

149 :名無しさん@お腹いっぱい。:2006/05/13(土) 10:48:14 ID:GHr1OPXr0
ほしゅ

150 :名無しさん@お腹いっぱい。:2006/05/13(土) 10:51:47 ID:8FiFduVc0
>>148
144が書かれた時点ではあったよ。

56の450mb.comも消えた。と思って探したら、
http://www.450mb.com/users/freeocr2/smartocr.html
というのを見つけたw

151 :名無しさん@お腹いっぱい。:2006/05/13(土) 11:12:10 ID:ged+oPbb0
和露他

152 :名無しさん@お腹いっぱい。:2006/05/13(土) 11:16:37 ID:nGoa270R0
糞味噌ワロスwwwwwwwwwwwwwwwww

153 :名無しさん@お腹いっぱい。:2006/05/13(土) 11:55:41 ID:4IAib/kM0
>>152
社員乙

154 :名無しさん@お腹いっぱい。:2006/05/13(土) 12:05:25 ID:nGoa270R0
パクリがばれるので止めてください><

155 :142:2006/05/13(土) 12:09:39 ID:U4JHsuuy0
ttp://www.filebank.co.jp/guest/hysknrs/smartocr
とりあえず作った
ゲストでもうp可能だからSmartOCRLite106.zipきぼんぬ

156 :名無しさん@お腹いっぱい。:2006/05/13(土) 12:19:43 ID:U4JHsuuy0
SmartOCRLite106.zipがあがってるけど0MBになってる
うp中かな?

157 :名無しさん@お腹いっぱい。:2006/05/13(土) 12:32:47 ID:U4JHsuuy0
数ファイルしかないんだからフォルダなんか作るなや

158 :名無しさん@お腹いっぱい。:2006/05/13(土) 12:40:30 ID:U4JHsuuy0
SmartOCRLite106.zip豚楠

159 :名無しさん@お腹いっぱい。:2006/05/13(土) 12:42:16 ID:ged+oPbb0
filebank wwwww 
キタコレ(;^ω^)

160 :名無しさん@お腹いっぱい。:2006/05/13(土) 12:48:29 ID:4IAib/kM0
>>155
入れないんだが・・・

161 :名無しさん@お腹いっぱい。:2006/05/13(土) 12:55:28 ID:U4JHsuuy0
>>160
入れるけど?
パスちゃんと入れた?

162 :名無しさん@お腹いっぱい。:2006/05/13(土) 12:57:05 ID:8FiFduVc0
>>160
filebankのパスワード欄は空白になっていないか?
155の目アド欄を見て入れてみ。

163 :名無しさん@お腹いっぱい。:2006/05/13(土) 16:46:08 ID:U4JHsuuy0
確認してみたら増えてるw

164 :お腹すいた…:2006/05/13(土) 17:01:43 ID:f+ouwxih0
パス入れてもムリ?

165 :名無しさん@お腹いっぱい。:2006/05/13(土) 17:05:29 ID:U4JHsuuy0
フォルダに入れても落とせない人は環境設定からブラウザモードにすると吉

166 :名無しさん@お腹いっぱい。:2006/05/13(土) 17:50:37 ID:U4JHsuuy0
荒れると難だからそろそろうp不可にするか

167 :名無しさん@お腹いっぱい。:2006/05/13(土) 18:03:04 ID:Cduw1T1V0
おまいらwikiって知ってるか?

168 :名無しさん@お腹いっぱい。:2006/05/13(土) 18:04:00 ID:3a9GCWsg0
ウキ?

169 :名無しさん@お腹いっぱい。:2006/05/13(土) 21:16:10 ID:4IAib/kM0
これってフリー版がリリースされただけだったの?

シェウェア版は?

170 :名無しさん@お腹いっぱい。:2006/05/13(土) 21:44:45 ID:375jvi9r0
ホムペよりコピペ

販売価格

SmartOCR 1.0 Professional Edition の販売価格は、1 ライセンス 378,000 円 (消費税込み、本体価格 360,000 円) となっております。

なお、2006 年 4 月 30 日受付分まで、発売記念キャンペーンとしまして、1 ライセンス 189,000 円 (消費税込み、本体価格 180,000 円) でのご提供とさせていただいております。

複数ライセンスを一括購入される際は割引もございます。お問い合わせください。


だそうな。

171 :名無しさん@お腹いっぱい。:2006/05/13(土) 21:45:42 ID:4IAib/kM0
Professional Editionうpお願いしまーす

172 :名無しさん@お腹いっぱい。:2006/05/13(土) 21:53:19 ID:mEJPoYsU0
なんだクレクレ厨かよ

173 :名無しさん@お腹いっぱい。:2006/05/13(土) 22:07:54 ID:Cduw1T1V0
189,000ってwwwww


174 :名無しさん@お腹いっぱい。:2006/05/13(土) 22:11:38 ID:4IAib/kM0
378,000ってwwwww

175 :名無しさん@お腹いっぱい。:2006/05/13(土) 22:16:03 ID:4IAib/kM0
http://www.filewatcher.com/_/?q=SmartOCR

176 :名無しさん@お腹いっぱい。:2006/05/13(土) 23:44:18 ID:9Bw1SrP60
1.07より1.06の方がええのんか?

177 :名無しさん@お腹いっぱい。:2006/05/14(日) 01:41:08 ID:7kc/t2yq0
filebankのダウソに成功!95はファイルダウソできねーんだって(もー

178 :名無しさん@お腹いっぱい。:2006/05/14(日) 02:06:41 ID:S6dHpXcb0
103から104で一気にファイルサイズが増えてるな

179 :名無しさん@お腹いっぱい。:2006/05/14(日) 02:15:01 ID:S6dHpXcb0
試しにゲストのうpを再開

180 :名無しさん@お腹いっぱい。:2006/05/14(日) 09:52:05 ID:isPuXRoB0
>>155

ただし、3日に一度ログインをしませんと、
保管したデータは削除されますので、ご注意下さい。

181 :名無しさん@お腹いっぱい。:2006/05/14(日) 11:08:51 ID:csKaAcPS0
>>124 :名無しさん@お腹いっぱい。 :2006/05/11(木) 04:23:51 ID:EEVmh9Wi0
> 民事だろ。しかも親告罪。
> 訴えられて、裁判に負ければ賠償金。

著作権の侵害に対して民事で訴えるのはいつでも可。
親告罪というのは、権利者が告訴すれば3年以下の懲役又は300万円以下の罰金
が、賠償金の他におまけでついてくる可能性があるってこと。


182 :名無しさん@お腹いっぱい。:2006/05/14(日) 11:28:40 ID:J+wt7Gdo0
なるへそ

183 :名無しさん@お腹いっぱい。:2006/05/14(日) 19:32:41 ID:S6dHpXcb0
>>180
分かってるよ
やっぱ他のバージョン持ってる人いなさそうなのでゲストうp不可再開

184 :名無しさん@お腹いっぱい。:2006/05/14(日) 20:45:04 ID:+YL1CFnm0
むしろ、この流れでは、大元のOCRソフトの権利者からの攻撃の方が可能性ある。
(「パクった」っていうのが本当だとして)
詳しい法解釈なんかはそれぞれ調べてみてくだされ。

185 :名無しさん@お腹いっぱい。:2006/05/14(日) 21:05:26 ID:WrX96/0E0
著作権法嫁



186 :名無しさん@お腹いっぱい。:2006/05/14(日) 21:19:41 ID:32nAxdZ60
なにもそんなにガツガツしなくても
PCjapan6月号にSmartOCR1.07入ってるで。
しょんぼりして本屋で立ち読みしてたら見つけた。

187 :名無しさん@お腹いっぱい。:2006/05/14(日) 21:25:19 ID:McYVxA/O0
>>185
読んでるつーの

188 :名無しさん@お腹いっぱい。:2006/05/14(日) 21:50:40 ID:S6dHpXcb0
>>186
>>100で既出(5月号って言ってるけど

189 :186:2006/05/14(日) 22:41:34 ID:32nAxdZ60
>>188
今本屋に並んでる6月号にも入ってるってことです。
消えてると思ったんだけど。

190 :181:2006/05/15(月) 06:34:34 ID:1Va00O5g0
>>184
まぁ142が勇者であろうということは認めるんだが、かなり無謀な感じはする。
スマートリーディングが「資金繰り悪化等」なんて言って突然やめたんだから
なんらかの債権者がいるんでは?
filebank経由で142を民事、刑事の両面で訴えてくる可能性があるんじゃない
かな?


191 :名無しさん@お腹いっぱい。:2006/05/15(月) 08:57:29 ID:P2UgZpvz0
filebankは著作権違反の対応鈍いからなぁ。

192 :142:2006/05/15(月) 18:07:03 ID:wtnjcxEq0
>>190
むしろ無謀な勇者は>>56でしょ

193 :名無しさん@お腹いっぱい。:2006/05/15(月) 19:20:33 ID:A3En0gYA0
今ごろ、パクられた会社の弁護士が、このスレをみてソロバンをはじいているだろう

194 :181:2006/05/15(月) 20:43:01 ID:1Va00O5g0
今北ですが、たしかに弁護士としては「ラッキー!」てところですかね。

142氏にとって、アンラッキーなのはfilebankが国内(それも弁護士が山ほどいる
東京)で東京地裁から証拠保全命令が出せること。(海外のサイトだと面倒)。
このためこの142氏が簡単に特定できること(不明であれば2chにも請求可)。
filebank からのダウンロード数が明快で、被害額が特定できること。
Liteは無料でも再配布を認めていなかったこと。加えて10日に再配布を
とりやめるように著作権者が要請したことを知っていたのにあえて再配布
していることから刑事での責任も重大…
(著作権法は読んだんだよね?コピー手段を提供したものも同罪って…)

Liteが無料配布だったからって、被害額は特定できるんだよね。それは、
Liteを無料で配布したために製品版もしくは同等品を販売するチャンスが
減ったと言えるから。これは知的財産侵害でよくあるやり方。
僕が弁護士なら36万円×ダウンロード数をとりあえず被害額として請求するかな。
民事で徹底的に争う気なら、刑事もあるからね。(親告罪ってのはそういうこと)

僕の感じでは、56氏の方は免責される可能性は高いかも?
理由は、56氏がスマートリーディングが再配布手段を失ったための配布を代替
するボランティア活動を意図したと解釈し得ること。
さらにスマートリーディング社の10日の広告で直ちに配布を取りやめたことで、
56氏自身が過誤を認めていること。仮に刑事告訴しても起訴猶予か?
これに対して142氏は新たに始めて、こうしてこのスレの一部の意見(助言?)
もあるのに、配布を続けていることは悪質とされ得るわけ。

とりあえず、181としては、どうなってももう知りませんw


195 :名無しさん@お腹いっぱい。:2006/05/15(月) 20:50:47 ID:wtnjcxEq0
まあそろそろ消すか

196 :名無しさん@お腹いっぱい。:2006/05/15(月) 21:13:20 ID:1Va00O5g0
>>195
まぁ、142氏が弁護士に駆け込むことはないと思うけど、もしも行けば、
「あ、これはまずいですねぇ…」て言われるかも。

もちろん消した方がいいと思うけど、すでに向こうはこのスレも含めて、
山ほど証拠握っていると思うし、ダウンロード数がゼロってことはない
でしょ?
企業なんて、自分に不利益にならない限り、金が取れれば訴訟はいく
らでもしますからね。


197 :名無しさん@お腹いっぱい。:2006/05/15(月) 21:18:09 ID:wtnjcxEq0
【ちょっと質問】
具体的にスマートリーディング側の不利益は?

198 :181:2006/05/15(月) 21:26:44 ID:1Va00O5g0
>>195
おまけ: FILEBANKのアナウンスだけど…(先に書いておけばよかったかも?スマソ)

http://www.filebank.co.jp/cgi-bin/main/main_template.cgi?link=cleancampain
・著作権違反ファイル

また、著作権違反ファイルは著作権者より莫大な損害賠償を課せられる可能性がございます、
ファイルバンクを利用した著作物の公開や交換はくれぐれも行わないようにお願い申し上げます。

http://www.filebank.co.jp/cgi-bin/main/main_template.cgi?link=privacy_policy
4、個人情報の第三者提供について

・ お客様が公共良俗、法令、当社利用規約などに反し、第三者や当社の権利・サービスを保護するために、必要と認められる場合。
・ 裁判所、検察庁、警察、弁護士会、消費者センターまたはこれらに準じた権限を有している機関から、個人情報についての開示を求められた場合。


199 :名無しさん@お腹いっぱい。:2006/05/15(月) 21:52:43 ID:64hVoFYs0
パクリ疑惑をまとめれば、公然と配布しても誰にも文句は言えない。
著作権法がそれを認めてるから。

200 :名無しさん@お腹いっぱい。:2006/05/15(月) 22:37:57 ID:YSr5bO120
>181=194=196=198

ちょっと粘着気味だな。
「過誤」という用語の使い方が少し変で、
法律屋であるかも疑問。

201 :名無しさん@お腹いっぱい。:2006/05/15(月) 23:46:36 ID:oTIzafs60
再うp頼みます

202 :名無しさん@お腹いっぱい。:2006/05/16(火) 06:50:09 ID:t049jPgS0
>>181
こんなパクリソフトの再配布に文句垂れる位なら
新メモリ最適化ツールのガキにでも粘着してこいよ

203 :名無しさん@お腹いっぱい。:2006/05/16(火) 07:09:56 ID:i/HGobXL0
ファイルバンクオワタ\(^o^)/
だれか再うpお願いしますorz

204 :名無しさん@お腹いっぱい。:2006/05/16(火) 10:26:52 ID:Xerb6WEC0
うわ、乗り遅れた…
ttp://newsstation.info/up/upload.cgi

流れにくいからここでのうp頼む・・・

205 :名無しさん@お腹いっぱい。:2006/05/16(火) 15:24:13 ID:SG1pZd620
うぉ、自分もまにあわんかった。
どなたか、たのんます。


206 :名無しさん@お腹いっぱい。:2006/05/17(水) 15:34:18 ID:MNLj8JSA0
p2pを利用したらいいじゃない

207 :名無しさん@お腹いっぱい。:2006/05/17(水) 17:20:35 ID:b3vuFwJq0
>>206
ダウン厨はダウン板に帰れ

208 :名無しさん@お腹いっぱい。:2006/05/17(水) 19:11:54 ID:Knze7zea0
>作者
チラチラ見てんじゃねーよw

209 :名無しさん@お腹いっぱい。:2006/05/19(金) 20:33:06 ID:DnybOIRW0
付録のDVDに入ってる雑誌買えよ。

210 :名無しさん@お腹いっぱい。:2006/05/19(金) 22:50:54 ID:xNufcQXS0
smartOCRアップローダーで頂けないでしょうか?

211 :名無しさん@お腹いっぱい。:2006/05/20(土) 00:21:42 ID:316S079V0
PCJapan・・・高い雑誌だな。しかもソフトバンク。。。
雑誌買わせる方向に誘導してるような気もしないでもない。
やっぱ雑誌売るための罠かな。俺は買わないな。

パソコン系の雑誌って買わなくても困らないんだよね。
買わなくなって5年位は経ってるなぁ。

212 :名無しさん@お腹いっぱい。:2006/05/20(土) 02:47:10 ID:zc//6BGm0
立ち読み最強

213 :名無しさん@お腹いっぱい。:2006/05/20(土) 06:01:10 ID:46cvk59m0
>>212
付録抜き取るのは万引きですよ

214 :名無しさん@お腹いっぱい。:2006/05/20(土) 08:49:35 ID:DrsH0FrP0
>203,204,205,210

海外のアップローダーで26MBのzipファイルをアップで
きて、アップされたことがわるうようにリストに載るところを
教えろ。
「○○にアップした」と言った時点で2chのログからアシが
ついてしまうから、慎重になるんだよ。
といっても、俺はアップしないけどなw


215 :名無しさん@お腹いっぱい。:2006/05/20(土) 09:50:54 ID:yf1cFYUN0
>>214
http://rapidshare.de/

216 :名無しさん@お腹いっぱい。:2006/05/20(土) 14:12:04 ID:Uy3vyKaU0
FreeFileHosterかMEGAUPLOADの方がよさそう

217 :名無しさん@お腹いっぱい。:2006/05/20(土) 14:49:04 ID:DrsH0FrP0 ?
http://www.filecache.de/

http://www.filecache.de/fileindex/
がリストになっている。ダウンロードは要登録。

218 :名無しさん@お腹いっぱい。:2006/05/20(土) 16:39:57 ID:Uy3vyKaU0
h抜いとけ

219 :名無しさん@お腹いっぱい。:2006/05/21(日) 01:52:32 ID:wYeqtwox0
\(^o^)/オワタ

220 :名無しさん@お腹いっぱい。:2006/05/21(日) 03:20:10 ID:aBNJIbFm0
ユー ザーネ ームもパ スワー ドもメー ルアドレ スも適当に入力でダウンロードできそうだな



221 :名無しさん@お腹いっぱい。:2006/05/21(日) 14:44:16 ID:pKkiP3YB0
p2p?

222 :名無しさん@お腹いっぱい。:2006/05/21(日) 18:39:08 ID:bNNpXvvL0
smartocrのオンラインヘルプを置いていた450mb.com
が消えたので、別のところに置きました。

ttp://three.fsphost.com/freeocr/smartocr.html

223 :名無しさん@お腹いっぱい。:2006/05/21(日) 19:06:30 ID:PoLDvuzO0
ヘルプファイルの人はいづこへ

224 :名無しさん@お腹いっぱい。:2006/05/21(日) 20:28:48 ID:kD/GWFiY0
>>222
圧縮してまとめて

225 :名無しさん@お腹いっぱい。:2006/05/21(日) 22:43:02 ID:bNNpXvvL0
>224
204サソのロダにアップしました。

226 :名無しさん@お腹いっぱい。:2006/05/21(日) 23:59:02 ID:kD/GWFiY0
サンクス

227 :名無しさん@お腹いっぱい。:2006/05/23(火) 02:05:43 ID:pBITt6Mx0
ttp://newsstation.info/up/img/ns9329.zip

228 :名無しさん@お腹いっぱい。:2006/05/24(水) 06:37:26 ID:O9GIlUPh0
>227
GJ

229 :名無しさん@お腹いっぱい。:2006/05/26(金) 14:14:44 ID:88AUr9SH0
GJ

OCR初体験だったのだが、smartOCRいいね。
今までちょっとしたものを手打ちしてたんだが、
無駄なことをしていたものだとショックを受けた。

230 :名無しさん@お腹いっぱい。:2006/05/26(金) 16:09:07 ID:9fAOm0gt0
そういえば、水戸黄門ってまだ続いてるの?

231 :名無しさん@お腹いっぱい。:2006/05/29(月) 01:01:54 ID:idiSaaFc0
>>229
確かにいい感じだな。
どっかこれ権利買い取ってフリーで再公開してくれんかねえ。
広告モデルでも全然構わんから。
これ使ってればいいんだが、公開終了してるのは何か気持ち悪い。
一応、他にもフリーなOCRはまだあるにはあるが、
中華企業の認識率糞、縦書き不可の相当微妙なものしかねぇ。

232 :名無しさん@お腹いっぱい。:2006/05/29(月) 10:42:57 ID:XLsqYzXY0
危倶 → 危惧
割と良く出る間違いその1
タイピストですが

233 :名無しさん@お腹いっぱい。:2006/05/29(月) 11:28:43 ID:xRqvGjX70
読取革命が一番良かった。

234 :名無しさん@お腹いっぱい。:2006/05/29(月) 22:26:40 ID:KMpdN7SB0
読取物語がダントツで一番良かった。

235 :sage:2006/05/30(火) 01:34:01 ID:HiFzZ9Ao0
うわーん出遅れた
>92をどなたかplz!

236 :名無しさん@お腹いっぱい。:2006/05/30(火) 01:39:12 ID:HiFzZ9Ao0
235デスガ・・・orz スマソ、忘れて・・
>227トンクスコ!

237 :名無しさん@お腹いっぱい。:2006/05/30(火) 19:31:09 ID:IQxPnUIo0
>>227
リンク切れでした。
誰か再うpしてください。

238 :名無しさん@お腹いっぱい。:2006/05/31(水) 09:35:05 ID:/Y6CSn5f0
>>237
次から次へとお前が沸いて永遠に繰り返すことになりそうだなw

239 :名無しさん@お腹いっぱい。:2006/05/31(水) 12:05:08 ID:K+V34f0CO
>>238
お願いします。
放(ryしてキャッシュ貼りますから。

240 :名無しさん@お腹いっぱい。:2006/05/31(水) 12:06:57 ID:K+V34f0CO
↑間違った。
放(ryしてハッシュ貼りますから。

241 :名無しさん@お腹いっぱい。:2006/06/02(金) 16:52:22 ID:jAfS9VzD0
もう雑誌にはいってねーのか?

242 :名無しさん@お腹いっぱい。:2006/06/03(土) 01:36:12 ID:h8UsTG7k0
227まだあるじゃん

243 :名無しさん@お腹いっぱい。:2006/06/04(日) 13:18:38 ID:EbDdenWLO
>>227はあるけど、中身の本体のリンクが切れてる。

ということでうpしてくだちゃい

244 :名無しさん@お腹いっぱい。:2006/06/04(日) 19:25:16 ID:5Ul1i0jX0
>>238
それどころか、
227ヘルプファイルをうp→便乗domが「本体のリンクが切れてるから、誰か下さい」と言い出す
→本体をうp→便乗dom「誰かヘルプファイル下さい」→227の(ry
という、悪夢のスパイラルに陥りそうな悪寒。

245 :名無しさん@お腹いっぱい。:2006/06/06(火) 00:12:29 ID:3Uhlse6K0
>>243
土曜の時点ではまだ落とせたんだよ

246 :名無しさん@お腹いっぱい。:2006/06/06(火) 00:13:40 ID:3Uhlse6K0
ああ、中身の本体かよ。PCJAPANでも買っとけ

247 :名無しさん@お腹いっぱい。:2006/06/06(火) 00:22:27 ID:bbj68jM10
というか、まだちゃんとうpされてるサイトあっただろ。
昨日の時点でまだダウソできたことを確認。
場所が場所だけにすげぇ低速だが。

248 :名無しさん@お腹いっぱい。:2006/06/06(火) 21:54:14 ID:Y7Ey0sUa0
どなたかSmartOCRうpまたは落とせるところお願いします

249 :名無しさん@お腹いっぱい。:2006/06/06(火) 22:35:56 ID:3Uhlse6K0
SmartOCR Lite Edition 等を許可無く再配布しないよう、お願いいたします。



2006 年 5 月 10 日
スマートリーディング







250 :名無しさん@お腹いっぱい。:2006/06/12(月) 00:58:24 ID:EfgArGT30
なくなった会社の許可がいるの?

251 :名無しさん@お腹いっぱい。:2006/06/12(月) 01:03:44 ID:i54ORezZ0
>>250
会社が無くなっても、著作権が無くならないよ。
借金取りが権利を借金の肩に持っていってるかもしれんし、
そうで無ければ、会社が持ってた権利が開発者に戻ってくるだけ。
特に、こいつら金に困ってるみたいだし、いらんこと配布してると
ハイエナのように金をたかってきそうw

252 :名無しさん@お腹いっぱい。:2006/06/12(月) 19:11:05 ID:46jEfGwo0
いつの間にか配布終了。出遅れた。orz

253 :名無しさん@お腹いっぱい。:2006/06/12(月) 22:25:29 ID:Z9cW+VzM0
パクリソフトってことがバレたから配布停止したんだろ

254 :名無しさん@お腹いっぱい。:2006/06/13(火) 21:10:38 ID:RiLCtO0J0
>>251
はあ?

255 :名無しさん@お腹いっぱい。:2006/06/13(火) 22:23:52 ID:xJ5atJ3m0
>>250
倒産しててもいるんじゃないかな。
ちょっと違うけどさ、作曲の著作権とかも、
本人の死後50年まで保護されるしさ。


256 :名無しさん@お腹いっぱい。:2006/06/13(火) 22:25:55 ID:lSx3pfSS0
会社じゃないだろ。対応とかどう見ても個人。

会社なら登記があるだろ?

257 :名無しさん@お腹いっぱい。:2006/06/14(水) 00:25:05 ID:gsxqzBqi0
>>256
>会社なら登記があるだろ?
ありますね

対応で個人か会社かなんてどうやって分かるの?

258 :名無しさん@お腹いっぱい。:2006/06/14(水) 00:58:34 ID:r3oxybTM0
採算性のなさ、2chと連動したタイミングで公開停止&配布禁止掲示・・・
どう見ても厨房の一人芝居です。本当にry

259 :sage:2006/06/14(水) 11:43:57 ID:YVIbalx90
とりあえずupたのむよ。

260 :名無しさん@お腹いっぱい。:2006/06/14(水) 19:59:48 ID:ha/FP+ct0
公開停止後にすぐVectorから落とした俺は勝ち組

本気で探してる人のためにMD5書いておく
700e932e22a5060013ca2b813d77479e  27,593,241バイト

261 :名無しさん@お腹いっぱい。:2006/06/14(水) 21:21:51 ID:Ack3TUTK0
υ

262 :名無しさん@お腹いっぱい。:2006/06/15(木) 19:24:03 ID:GBp8Hsyn0
>>251

>>そうで無ければ、会社が持ってた権利が開発者に戻ってくるだけ。
・・・?

263 :名無しさん@お腹いっぱい。:2006/06/15(木) 23:58:55 ID:s41MTfOS0
>>260
今でも落とせるから勝ち組でも何でも無いぉ

264 :名無しさん@お腹いっぱい。:2006/06/16(金) 01:12:05 ID:IAenTxiq0
>>263
どこ?

265 :名無しさん@お腹いっぱい。:2006/06/16(金) 12:00:05 ID:AbA1lTIW0
>>264
つ過去ログ
俺が落としたのは約1週間前だ。
今でも落とせるかは不明。

266 :名無しさん@お腹いっぱい。:2006/06/16(金) 14:56:53 ID:IAenTxiq0
>>265
今でも落とせた! 直リンでいけるね。
0f8adfc0
700e932e22a5060013ca2b813d77479e
60b786e33d2967852042e407dd2a7e83d905611f
だた。

267 :名無しさん@お腹いっぱい。:2006/06/16(金) 18:55:52 ID:nUW4iR/L0
>>266
もうどこもリンク切れちゃってますが

268 :名無しさん@お腹いっぱい。:2006/06/16(金) 19:14:51 ID:5Bc6E8UM0
>>267
>>217 ここに幸あり

269 :名無しさん@お腹いっぱい。:2006/06/16(金) 19:18:47 ID:nUW4iR/L0
>>268
ありがとう今落とせてる
ホントありがとう感謝するよ

270 :名無しさん@お腹いっぱい。:2006/06/16(金) 23:35:28 ID:YjKMQuMv0
わからなくてダウンロードできないので他のわかりやすいとこにアップしてくれませんか?

271 :名無しさん@お腹いっぱい。:2006/06/16(金) 23:49:49 ID:nUW4iR/L0
>>270
わからないことないだろう
>>217のところの下の検索ボックスにOCRでも入力して検索すりゃ出てくるよ
それか翻訳サイト使うか…

272 :名無しさん@お腹いっぱい。:2006/06/17(土) 00:13:51 ID:j43y7vvu0
>>271
人それぞれなんだからわからない人もいるって。
たぶん登録の仕方がわからないんじゃないかな?

273 :名無しさん@お腹いっぱい。:2006/06/17(土) 00:37:07 ID:okaBaelN0
このスレ、いい人が多いね。

274 :名無しさん@お腹いっぱい。:2006/06/17(土) 03:30:12 ID:zfgYpqKm0
>>272
登録?
いやいや何も登録しなくても落とせたんだけど…

275 :名無しさん@お腹いっぱい。:2006/06/17(土) 03:43:15 ID:Y9+rWGXx0
要登録はうpする場合だけ。
ダウソするときは登録はいらん。
実際、俺はそこから落としたしな。

276 :名無しさん@お腹いっぱい。:2006/06/17(土) 17:25:39 ID:BOfKv/jX0
>>268
無事落とせました。
dです。

277 :名無しさん@お腹いっぱい。:2006/06/17(土) 21:10:41 ID:x5i1fMpH0
なんでパクりだってわかったの?

278 :名無しさん@お腹いっぱい。:2006/06/17(土) 21:11:58 ID:P9wYutdB0
バグが同じ

279 :名無しさん@お腹いっぱい。:2006/06/26(月) 18:23:34 ID:KpardJRH0
どっかでDL出来ない?

280 :名無しさん@お腹いっぱい。:2006/06/26(月) 20:23:37 ID:YN1HXaSw0
>>279
>>217
ttp://www.filecache.de/75199819
ttp://www.filecache.de/52330047

281 :名無しさん@お腹いっぱい。:2006/06/26(月) 20:27:59 ID:YN1HXaSw0
⇒Datei jetzt herunterladen

282 :名無しさん@お腹いっぱい。:2006/06/29(木) 01:38:39 ID:xZue9U4M0
SmartOCR入れたんだけど、EXCEL形式でファイル保存できない・・・。
特に設定しなくても標準でできますよね?

283 :名無しさん@お腹いっぱい。:2006/06/29(木) 11:51:45 ID:m/Wzd3s30
エクセルだって所詮ローカルなソフト
標準でもなんでもない。

284 :名無しさん@お腹いっぱい。:2006/07/06(木) 20:40:42 ID:Br9WNg2Q0
フリーソフトにそんな必死にならなくても
P2Pで普通に流れてますよ

どのOCRソフト使ってもじぇんじぇんちゃんと認識されないんだけど
もうその画像はどんな方法使ってもダメですかね?
拾ったテキスト画像なんですけど

設定変えたりしたら認識率あがりますか?
どのソフトもデフォルトで適当にやって、ってのを次々試してるんだけど

285 :名無しさん@お腹いっぱい。:2006/07/06(木) 22:11:51 ID:njwgeoZV0
中国人に入力させたらOCR買うより安いよ

286 :名無しさん@お腹いっぱい。:2006/07/07(金) 19:59:44 ID:1oQDzUTY0
スレ違い

287 :名無しさん@お腹いっぱい。:2006/07/07(金) 20:17:53 ID:U6Ox1+uK0
>>284
dpiどんぐらいですか?
最低300dpiぐらいはないと実用的な精度はでないと思う。


288 :名無しさん@お腹いっぱい。:2006/07/08(土) 00:51:40 ID:PQ/pqC020
画像から文字へ変換したいファイルが数百あるのですが、
大抵のOCRソフトが大量変換を意図して作られていないようです。
こうした場合に適切なソフトは何でしょうか。

289 :名無しさん@お腹いっぱい。:2006/07/08(土) 06:38:57 ID:7QQFsHSO0
>>288
>大抵のOCRソフトが大量変換を意図して作られていないようです。
詳しくヨロ
具体的にどういう機能が大量変換向きなんだ???


290 :名無しさん@お腹いっぱい。:2006/07/08(土) 19:27:18 ID:PQ/pqC020
んー例えば、OCR側から対象の画像ファイルを手作業で指定させる
ような動作をすると、大量の画像からいちいち対象を指定させる
ことになるため、非常に手間がかかります。

うーん、わかりづらいですね。GUIよりCUI向きなのかな。
仮に、OCRをocr.exeとしてコマンドラインで使用できるとしましょう。

C:\>ocr.exe -i a.jpg -o a.txt

のように実行できればと考えています。

291 :名無しさん@お腹いっぱい。:2006/07/08(土) 20:38:44 ID:E/7p0F930
>>290
マクロ機能使ってないの?
一万枚くらいなら楽勝だよ。


292 :291:2006/07/08(土) 20:46:33 ID:E/7p0F930
例えば
読んdeココだったらOCRファクトリーの「画像をテキストファイルに」
で一気に変換できます。

他のソフトでもマクロ機能は用意されてると思いますよ。



293 :284:2006/07/09(日) 13:33:09 ID:sTcFgSd/0
>>287
72dpiでしたorz
5年前くらいにデジカメで撮られた画像らしいです
これしか画像がなくてこれをテキスト化したいのに…
手動でテキスト作るしかないかな
解像度をあげるソフトってないんですか?
なんか映画とかでよくぼやけた画像をピピっと綺麗になおしてますけど

294 :名無しさん@お腹いっぱい。:2006/07/09(日) 14:06:18 ID:G+2kfkf50
284 名前:名無しさん@お腹いっぱい。[] 投稿日:2006/07/06(木) 20:40:42 ID:Br9WNg2Q0
フリーソフトにそんな必死にならなくても
P2Pで普通に流れてますよ
284 名前:名無しさん@お腹いっぱい。[] 投稿日:2006/07/06(木) 20:40:42 ID:Br9WNg2Q0
フリーソフトにそんな必死にならなくても
P2Pで普通に流れてますよ
284 名前:名無しさん@お腹いっぱい。[] 投稿日:2006/07/06(木) 20:40:42 ID:Br9WNg2Q0
フリーソフトにそんな必死にならなくても
P2Pで普通に流れてますよ

犯罪者なので通報しておきますね

295 :名無しさん@お腹いっぱい。:2006/07/09(日) 14:13:39 ID:JIwVYg1M0
>>945
知りませんじゃねえよ。ちったあ考えろ。

296 :名無しさん@お腹いっぱい。:2006/07/09(日) 14:17:19 ID:JIwVYg1M0
すまん。誤爆。

297 :名無しさん@お腹いっぱい。:2006/07/14(金) 10:01:36 ID:H2lacOtO0
久しぶりに来たら、smartOCRのダウンロード先が書いてあるじゃないですか。
サンクス。

298 :名無しさん@お腹いっぱい。:2006/07/16(日) 23:10:46 ID:/eJmwKqQ0
普通OCRソフト使うのはスキャナを使うときでしょ?
んで、スキャナ買うとたいていOCRソフトがバンドルされてるわけだが、それでも
あえて使う価値あんの?>smartOCR

299 :名無しさん@お腹いっぱい。:2006/07/16(日) 23:26:37 ID:b3Rdho+m0
HPの多言語OCRは恐ろしくタコ

300 :名無しさん@お腹いっぱい。:2006/07/17(月) 01:43:29 ID:O7xJRJm20
smartOCR使ってみたが、はっきり言って修正するより最初から打ち直したほうが明確に速いレベルだ。
元の原稿はかなり綺麗だったのにOCRソフトってこんなもんなんだろうか。

301 :名無しさん@お腹いっぱい。:2006/07/17(月) 01:51:05 ID:If/Z+kH40
俺はスキャナ付属のOCRや体験版のOCRと比べてみたが
SmartOCRが一番認識が正確だった。

他のが90%としたらSmartOCRが99%以上ぐらい

302 :名無しさん@お腹いっぱい。:2006/07/17(月) 08:32:55 ID:78VlHxeJ0
>>301
全く禿同。

303 :298:2006/07/17(月) 12:10:25 ID:U3CEtzD60
>>299-302
なるほど。
とりあえず試してみる価値はありそう。
パクリとのウワサもあるが、要は出来が良ければよかろうなのだァ

304 :名無しさん@お腹いっぱい。:2006/07/17(月) 16:38:45 ID:3dDDjcAS0
smartOCRの精度は読取革命以下。読んでここは使ってないからわからん。
本格読取と同じくらいかな〜

305 :名無しさん@お腹いっぱい。:2006/07/18(火) 13:26:38 ID:UgKmiUz70
パクリじゃなくて元社員のソースお持ち帰りだろ
つまり、ソースを同じくする市販製品のどれかと精度は一緒

306 :名無しさん@お腹いっぱい。:2006/07/18(火) 16:14:05 ID:aB9zgZSk0
お前にはこれが足りないようだ

っ辞書

307 :名無しさん@お腹いっぱい。:2006/07/18(火) 17:30:47 ID:PNLoSI320
初期のソフト同士を比べても意味ないとおもう
学習と辞書登録しないとどれも使い物になんらし・・・

308 :名無しさん@お腹いっぱい。:2006/07/19(水) 04:34:20 ID:jdcDRxBu0
SmartOCRスゲー!!! 読んdeココなんか買わなきゃよかった!!!
>>280ガチでd


309 :名無しさん@お腹いっぱい。:2006/07/20(木) 00:34:18 ID:PBqegdpV0
発売中止後の人気が出るなんて
でも、あの価格じゃ売れないよな

310 :名無しさん@お腹いっぱい。:2006/07/20(木) 00:45:31 ID:3z81PHpX0
売らないつもり→某社が買おうとした→緊急発売停止

311 :名無しさん@お腹いっぱい。:2006/07/20(木) 21:57:29 ID:x0TH0cFO0
>>310
某社ってLivedoor?

312 :名無しさん@お腹いっぱい。:2006/07/21(金) 02:07:48 ID:KqBJHYi80
>>301
これホント?
スクリーンショットの場合だと70%くらいの出来だなあ

313 :名無しさん@お腹いっぱい。:2006/07/21(金) 03:32:47 ID:DOoxQ5qB0
>>312
エロ小説のスキャン認識で、修正なしでもあまり気にならず読めるくらい。

!とか?とか?の誤認識は結構ある

314 :名無しさん@お腹いっぱい。:2006/07/21(金) 11:09:01 ID:sEY0Mzm40
ルビどうするんだ?

315 :名無しさん@お腹いっぱい。:2006/07/21(金) 13:56:28 ID:DOoxQ5qB0
()に括って表示させる

316 :名無しさん@お腹いっぱい。:2006/07/23(日) 22:55:04 ID:clBRhjSd0
誰か>>222のヘルプを纏めてうpきぼん

317 :名無しさん@お腹いっぱい。:2006/07/23(日) 23:54:18 ID:1wJoQzQe0
>>315
結構手間掛けてるんだ

png読めないんだね

318 :名無しさん@お腹いっぱい。:2006/07/24(月) 16:24:46 ID:MEL9glNo0
ここ親切なやつが多すぎ





超ありがとう。

319 :名無しさん@お腹いっぱい。:2006/07/24(月) 18:45:12 ID:5RnBxMUA0
同じく、超ありがとう。

でもインストローラを実行するとスタートアップに何か登録されたお。これ何?俺だけ?
ちなみにインストローラの拡張子をcabに変えてインストすれば無問題でした。

320 :名無しさん@お腹いっぱい。:2006/07/24(月) 19:00:53 ID:oimwNy810
>>316
ttp://www.filecache.de/fileindex/
で、画面最下部のIndex-Suche:の
ボックスに「smartocr」と記入して
Suchen!

321 :名無しさん@お腹いっぱい。:2006/07/25(火) 20:45:36 ID:9vYDzWBh0
ありがとう

322 :名無しさん@お腹いっぱい。:2006/07/27(木) 23:53:02 ID:2bXNehB/0
>>320
ほんまあんがと

323 :名無しさん@お腹いっぱい。:2006/07/28(金) 16:24:50 ID:Zsc2pEXo0
smartocrも悪くは無いんだが機能制限で連続処理できないから不便だな
スキャンした小説をまとめて読み取るには読んでココとか使うしかないのか

324 :名無しさん@お腹いっぱい。:2006/07/28(金) 21:21:43 ID:h0H8l2BL0
マウス操作をマクロ化するフリーウェアでどうにか連続処理させてる

325 :名無しさん@お腹いっぱい。:2006/07/28(金) 21:58:14 ID:UWTSUIWE0
>>323
パッチあてればいいじゃん

326 :名無しさん@お腹いっぱい。:2006/07/28(金) 22:53:11 ID:WMt54gBJ0
>>325
サンクス、できた

327 :名無しさん@お腹いっぱい。:2006/07/28(金) 22:56:22 ID:Zsc2pEXo0
>>325
パッチなんてあるの?
すまんが詳しく教えてくれないか?

328 :名無しさん@お腹いっぱい。:2006/07/30(日) 21:22:12 ID:ubShczZl0
smartOCRでpdfからテキスト化ってできん?

329 :名無しさん@お腹いっぱい。:2006/07/31(月) 00:05:21 ID:RN8M8o5y0
>>328
マルチウザッ

330 :名無しさん@お腹いっぱい。:2006/07/31(月) 12:12:20 ID:fmSAcWfY0
パッチ見つけたんだけど
1.07用のしかない・・・
1.06もある?

331 :名無しさん@お腹いっぱい。:2006/07/31(月) 23:25:40 ID:JetuRet50
パッチを持っている方うpお願いします

332 :名無しさん@お腹いっぱい。:2006/08/01(火) 08:29:07 ID:2c/9wdgc0
>>330
nyで流れてるpro版(crack)じゃあかんんの?
1.06もあったお

333 :名無しさん@お腹いっぱい。:2006/08/01(火) 09:00:02 ID:vOY/YVWb0
W2FL回してもLiteしか引っかからん
ハッシュ張ってくれまいか?

334 :名無しさん@お腹いっぱい。:2006/08/02(水) 13:47:19 ID:jKqSHbs80
パッチをできれば320のサイトにアップしてくれ。
1つのサイトにまとまっていれば使いやすくなるから。

335 :名無しさん@お腹いっぱい。:2006/08/02(水) 17:34:42 ID:i1Pr84GE0
あー・・・誰か読んDEココの辞書UPしてくれねーかな・・・
修正イチイチやるのにもう疲れた・・・

336 :名無しさん@お腹いっぱい。:2006/08/02(水) 18:11:38 ID:D7ELxKnZ0
>>330-335
犯罪者死ね

337 :名無しさん@お腹いっぱい。:2006/08/02(水) 21:42:03 ID:kcCMiG1W0
画像→テキストと聞いて思い浮かんだんだが、ビットマップの画像データを16進数の文字データに変換できたらおもしろそうだね。
#000000から#FFFFFFを使って、HTMLに絵を変換しちゃうかんじの。
もしなかったら作ろうと思ったんだけど、どうかな。

338 :名無しさん@お腹いっぱい。:2006/08/02(水) 22:35:23 ID:kQooJzkQ0
あほ?
ビットマップはバイナリで同じようなこと実現してるんだから、データ量が増えるだけ。

339 :名無しさん@お腹いっぱい。:2006/08/02(水) 23:11:26 ID:OcRUZ++g0
ちょっと話を遮ってすまん。

340 :名無しさん@お腹いっぱい。:2006/08/03(木) 00:00:46 ID:iWn6RE2Q0
用件は?

341 :名無しさん@お腹いっぱい。:2006/08/03(木) 00:03:21 ID:4MUFkbB30
あほ?

342 :蕪木ら某 ◆Googl8RmwA :2006/08/03(木) 00:40:18 ID:xzisirSD0
( >>337-338 + http://www.google.co.jp/search?q=table+art )

343 :名無しさん@お腹いっぱい。:2006/08/06(日) 17:23:12 ID:5mCH8TkK0
>>332
著作権法違反幇助の罪で通報しますた。
少なくとも金子よりは露骨な幇助だな。

344 :名無しさん@お腹いっぱい。:2006/08/06(日) 17:25:57 ID:5mCH8TkK0
>>312
OCRは使い込む毎に傾向を学習するような機能を実装するのが普通だから
使い込んだSmartOCRが有料商品より優れてても何の不思議はない。
学習済み製品>学習済みSmartOCR>未学習製品>未学習SmartOCR
?%        99%           90%      70%
だったってだけだろ。

345 :301:2006/08/06(日) 18:17:24 ID:Na9dQa9x0
400文字に4箇所でも1%の誤認識だよ?
認識率99%でも誤認識自体は結構あるわけで特別正確というわけじゃない。

346 :名無しさん@お腹いっぱい。:2006/08/06(日) 18:59:17 ID:WiVrJ4hk0
アホ?
396文字は正確に認識できてるわけだし

347 :名無しさん@お腹いっぱい。:2006/08/06(日) 19:05:32 ID:Te5d4kQG0
夏だなぁ

348 :名無しさん@お腹いっぱい。:2006/08/06(日) 21:06:32 ID:YwNa65u70
>>345
今の時代で1%の誤認識なら
十分正確と言えるよ

349 :名無しさん@お腹いっぱい。:2006/08/06(日) 21:58:43 ID:Dk7evszD0
>>344
たぶん夏釣りだと思うけど一応レス

学習済みOCR>>未学習SmartOCR≧未学習その他OCR製品

実際こんなもん。
最近のOCRソフトは性能が右肩上がりだから、
少しカスタマイズしたり学習させたりすることで顧客の満足が得られるレベルになるよ


取り合えずOCRがよくわかんねぇ奴は無料のSmartOCRlite使っとけ!
SmartOCR作ってたスマートリーディング社は倒産してるから工作員もいねぇしなw

350 :名無しさん@お腹いっぱい。:2006/08/07(月) 11:16:43 ID:qZq47fmj0
学習済みSmartOCRpro>>>未学習SmartOCRpro>>学習済みSmartOCR>学習済みOCR>>未学習SmartOCR≧未学習その他OCR製品

351 :名無しさん@お腹いっぱい。:2006/08/07(月) 12:10:55 ID:qFOTuJog0
OCROCRうざいからOCRをNGワードにした。

352 :名無しさん@お腹いっぱい。:2006/08/07(月) 14:55:38 ID:zVynDYiY0
SmartOCRは社員の持ち出しな上、読んでここよりちょっといいくらい。辞書だっておそらく流用だろうし。


353 :名無しさん@お腹いっぱい。:2006/08/07(月) 16:34:14 ID:7pOEwcrp0
>>352、日本人ならもちっと文をまとめようぜ

・SmartOCRは社員の持ち出し(意味不明)
・私はSmartOCRの方が読んde!!ココより僅かに優れてると思っている
・私はSmartOCRで使用されている辞書は流用だと想像している

まず箇条書きでまとめてみた
さて再度一つ一つの文の説明をしてくれ

354 :名無しさん@お腹いっぱい。:2006/08/07(月) 18:50:37 ID:zVynDYiY0
要するにパクリ製品で、辞書を流用してて、ヘボ商用OCRよりマシってことだ。
説明もなにも、過去ログに書いてあることをまとめたに過ぎない。

355 :名無しさん@お腹いっぱい。:2006/08/07(月) 23:49:47 ID:Qv4+7ueU0
>>353
日本人なら>>352ぐらい解読しようぜ。よほど文盲じゃない限り意味は分かる。

356 :名無しさん@お腹いっぱい。:2006/08/08(火) 00:05:58 ID:7pOEwcrp0
単なる皮肉じゃねーの?

357 :名無しさん@お腹いっぱい。:2006/08/08(火) 02:04:46 ID:t9gg1Fnb0
単なる池沼だろ。
それか中の人がファビョってるのか。

358 :名無しさん@お腹いっぱい。:2006/08/08(火) 02:10:21 ID:uq6ary4N0
夏だなぁ

359 :名無しさん@お腹いっぱい。:2006/08/08(火) 08:46:43 ID:t9gg1Fnb0
夏だなぁ厨

360 :名無しさん@お腹いっぱい。:2006/08/08(火) 17:12:44 ID:3QjCPQSG0
>>352を読んで理解できなかったID:7pOEwcrp0

文を纏めろといいながら「読んでここよりちょっといいくらい」を「読んde!!ココより
僅かに優れてる」と捏造してしまうID:7pOEwcrp0

反論されたので、日にちも変わったことだし他人のふりして擁護しようと自演した
ら、まだIDが切り替わってなかったID:7pOEwcrp0


さて日本語が理解できなくて捏造大好きで自演までしちゃうのは誰でしょう?w

361 :名無しさん@お腹いっぱい。:2006/08/08(火) 19:51:33 ID:UyzJNkd70
>>360
「僅かに」を「遥かに」と誤認識した、に1票

362 :名無しさん@お腹いっぱい。:2006/08/08(火) 19:56:01 ID:SlWnD/4h0
>>360
文盲カッコワルイw

363 :名無しさん@お腹いっぱい。:2006/08/09(水) 00:08:21 ID:amjlGhB40
わかり辛いスレだな。
誰かOCRにかけてくれ。

364 :名無しさん@お腹いっぱい。:2006/08/09(水) 08:08:32 ID:iYEfwOXm0
わかつナこ

365 :名無しさん@お腹いっぱい。:2006/08/10(木) 05:43:59 ID:Mw/M2k+w0
SmartOCRのことで、教えてくれ。

どうして1.0.6の需要があるの?
最新版の1.0.7にはない機能があるとか。

教えて君で申し訳ない。

366 :名無しさん@お腹いっぱい。:2006/08/10(木) 14:26:00 ID:jb2eTzx50
>>365
マルチやめれ
関連スレの過去ログ読むかググれよ

367 :名無しさん@お腹いっぱい。:2006/08/10(木) 14:37:36 ID:XmxyRxn90
107は精度が落ちてるから

368 :365:2006/08/10(木) 18:46:25 ID:Mw/M2k+w0
>366
マルチ違う
関連スレも見たぐぐった

>367
教えてくれてありがd

お礼に教える君になります。
320のページで検索(Suchen)すると、検索結果が
今までより1個多くなっている。さてなんでしょう(w

369 :名無しさん@お腹いっぱい。:2006/08/13(日) 08:44:48 ID:eMHMvqto0
何で読取革命が人気ないかわからん。俺の環境だと
読取革命>>e.Typist>読んで   e.Typistは体験版、他は最新版。

今度からランク付けする場合、どんな資料読み取ってるか書いてもらいたい。

俺が読み取ってるのは図形、表、字混合、白黒の資料


370 :名無しさん@お腹いっぱい。:2006/08/13(日) 09:54:26 ID:GICVZJIQ0
ジャケ画の歌詞画像スキャン結果だと
読取革命>e.typist>読んでここ>SmartOCR
全部体験版の初期状態ね。

371 :名無しさん@お腹いっぱい。:2006/08/13(日) 14:27:28 ID:yMWJsO350
ヒント:金出して買えない厨房の溜まり場


372 :名無しさん@お腹いっぱい。:2006/08/13(日) 17:43:34 ID:6jIuQ4Dp0
自覚してるわけですか

373 :名無しさん@お腹いっぱい。:2006/08/13(日) 22:26:50 ID:yMWJsO350
まあ読取革命は本格読取からの優待で安く買ったけど

374 :名無しさん@お腹いっぱい。:2006/08/14(月) 02:38:29 ID:2kxjreYM0
初期状態でのOCR精度比べても無意味だろ
学習させないととてもじゃないが使い物にならんよ

375 :名無しさん@お腹いっぱい。:2006/08/14(月) 10:17:04 ID:sle7CdNN0
段落を取れん場合は、学習機能も無意味。
段落のとり方を学習できる製品はないのかな。

376 :名無しさん@お腹いっぱい。:2006/08/15(火) 01:41:50 ID:f2VQuwo60
ある

377 :名無しさん@お腹いっぱい。:2006/08/15(火) 16:09:35 ID:f/D0Xu0a0
OCRを使ってますか?
http://pc8.2ch.net/test/read.cgi/bsoft/1141402809/

378 :名無しさん@お腹いっぱい。:2006/08/31(木) 18:22:56 ID:bjz28sKf0
SmartOCRのヘルプページのサイトは、http://three.fsphost.com/freeocr/から

http://ocr.rossa.cc/

に移転しました。
多分、今までよりも快適に読むことができると思います。

379 :名無しさん@お腹いっぱい。:2006/09/06(水) 19:12:26 ID:yw7232fl0
表面的な匿名をいいことにマナーが悪すぎるな

380 :名無しさん@お腹いっぱい。:2006/09/06(水) 20:18:47 ID:fi4e3w9G0
製品パクってくるよりまし

381 :名無しさん@お腹いっぱい。:2006/09/09(土) 20:06:25 ID:Zk6MRhKi0
2chでマナーとかいいだしたらキリが無いですよ。ぜんぜん大人しいほう。

382 :名無しさん@お腹いっぱい。:2006/09/13(水) 16:13:30 ID:8KtJLkVe0
 

383 :名無しさん@お腹いっぱい。:2006/09/20(水) 16:39:06 ID:T4QOs50J0
Smart OCRを初めて知ったので、今落とせてサンクス。

384 :名無しさん@お腹いっぱい。:2006/09/26(火) 22:06:44 ID:B0JYe+LK0
>>381
表だっては掲示板内で違法行為働いてることを堂々と書き込んでいるのはあまり見ない。
違法を違法と理解してない風な書き込みは流石に痛い。
そういうのがパクリを叩くのもまた痛い。

385 :名無しさん@お腹いっぱい。:2006/09/28(木) 03:50:29 ID:y+zC8mrs0
つまりsmartOCRは社員がどこかのocrソフトメーカーからソースぱくってつくたってこと?

386 :名無しさん@お腹いっぱい。:2006/09/29(金) 00:11:09 ID:Yq1fsyDX0
表の読み取り最強なのはどれ?
ちなみに、表=主に数字と定型的な単語のみで構成され、罫線で囲まれたもの ってことで。

日本語文書読解とかどうでもいいんで、望む機能としては
1.罫線の存在を認識できる = 点線を一や−の連続と思わないこと等
  (ユーザーの設定により罫線ありと明示的に設定できるとなお良)
2.表のテンプレート設定が豊富 = セル・行・列指定で数字のみや記号のみに限定できる等
  (細かく文字を限定できればなお良 例:「\19,800」みたいな価格→「数字 , \」、電話番号→数字と"−"のみ)
3.数十枚〜数百枚程度の自動認識機能

387 :名無しさん@お腹いっぱい。:2006/09/29(金) 00:20:02 ID:Yq1fsyDX0
読取革命の体験版を試してみたんだけど、これって一度作ったテンプレートの融通が利かないんだね。
例えば帳票をADFで連続読み取りしてると、どうしても2〜3ミリくらいは上下左右にずれちゃうんだけど
テンプレートを呼び出したあと、ちょっとだけ位置を修正しようと思ってもこれが出来ない。
無理やり移動したり大きさ修正しようとすると、設定したセルや文字種が全部デフォルトに戻るw
表専用OCRじゃないから多くは望めないとはいえ、これはちょっと酷いんじゃないのかな〜。

前の職場で使われてた業務用OCRは優秀だったんだよね。
テンプレート位置を、画像上の罫線を参照して自動修正してくれたり
ガチで連続読み取りに特化してた。

388 :名無しさん@お腹いっぱい。:2006/09/29(金) 02:30:08 ID:90PHlJ6J0
つーかスマートOCR誤字ばっかりでぜんぜん読み込まない
どっかに横文字で書いただけの文字の画像ないかな

つーかこのスレをスクリーンキャプチャしてみるか。

389 :名無しさん@お腹いっぱい。:2006/09/29(金) 02:37:58 ID:90PHlJ6J0
]9fi:名畑しさん@お腹いっぱい.:2田10∈/ng,'pa(木)0:ifio:四ID:y4■CRTrcO
つよU垢rErtOCRば社員がどこかの阻rソフ1・1其一カーからソースぱく丁て]くた.」てこと?
t
瑚:名無しさん@お腹い]ぱい.:2田10[fn9,'29(k')OO.11.α91DY目1国DXO
却]請み取り最桂なのばど.れ7
ちなみに、表一土に数字と定型AMs単語のみで構成され、罫腺で匝まηたものーてことて.
ヨ本語文書読解とかピうでもいいんで、望む機能としてば
1.…:線の存在菅詔識でぎる一点線を一や一の連続ヒ思わないこと等
(「一サーの設定:「より罫線あり1と明示的「設定できる仁なお良)
■■.表のアンプレー-設定が豊富-セル'fi一列指尼で数字のみ阜記号の捌こ眠定できる等
鰍ゥ(Y字}1狼定できれ1:碍「焉-仲1」:「UIF.Rnfi」みt'1.ln伍格→R歌字.耳」.雪話番岩→?.享t'一'Mh:)
3.数十枝一数百枝程度の目動認識機能
脚:名無しさん@お腹いっぱい.:PfCEIng,'pn(金)OO:20:nP TD:YclkvDXO
読取革命の構験版を証して碍たんだ∪ど、これって一劇乍ったテンプレートの甜動荒不1-VL'td■,んだね.
側えば帳草をA[Fで連続読み取りしてると、どうしても2〜3ミリくらいば上下左右にずれちゃうんだけど
アンプレー1-琶呼ぴ山したあと、ちょ訓とだけ位置古修工しようこ思ってもこhhU来奄い.
無哩やり樗動しr一り六芦ざ條[Fしようと丁るk.設定し斤ヤ」しヤ夏字植が全部デフォルトに戻るw
表専用DC屯拝ないから多くば茎めたいとばいえ、こればちょ北酷いんしドtsいの右.な一...
前刃職場で使われてだ茉務用DCRば優秀だ丁だんだよね。
テ?」レート位直を、画像上の罫線を参照して目動修正してくILt[り
ガチで連続読み取リに特化してた.
]SE:名無しさん@お腹いーぱい.:2fmE/ng,.pg(金)D2:田:nETD:叩PHL旧.-ID
つ一研スマートOCR誤字は.・h,りでぜんぜん読み込よない
どっか[こ構夏宰で書.,r一戸'けの又=の由偉煎.巾噴
つ一MILCjxレ芒スクリーノキャプチャし⊂みるか。
.一ワ汀表NnlL,た
ー「「「一一一一一一一三]


390 :名無しさん@お腹いっぱい。:2006/09/29(金) 08:13:46 ID:0aDHtvHn0
>前の職場で使われてた業務用OCRは優秀だったんだよね。

それが何だったか覚えてないの?それ使えばいいだけだと思うんだけど。

391 :名無しさん@お腹いっぱい。:2006/09/29(金) 19:12:19 ID:EG4JKPXp0
エプソン、エー・アイ・ソフトを吸収合併
http://pc.watch.impress.co.jp/docs/2006/0929/epson.htm

392 :名無しさん@お腹いっぱい。:2006/09/29(金) 23:03:15 ID:NpqBn/zy0
>>391
創業23年を目前にして、その歴史に幕か・・・。
まあ、「読んde!!ココ V.12」のパッケージに"EPSON"ロゴが入った時にそんな予感はしていた。
あと、EPSON製ソフト「オフィリオ・シナジーウェア」との連携をやたら強調したり・・・。

合併後も、EPSONが積極的に売り出しそうなのは、「読んde!!」等OCR系と「デジカメde!!」シリーズぐらいか?
DiskX、まっぷっぷ、訳せ!!ゴマとかは放置プレーかな・・・。
ひとまず合掌。

393 :名無しさん@お腹いっぱい。:2006/09/29(金) 23:21:31 ID:qqH6EebL0
WXが・・・

394 :名無しさん@お腹いっぱい。:2006/09/30(土) 17:07:10 ID:ocwN+jtc0
読んdeみたいなクソソフトは消えても全くどうでもいい

・・・といいたいところだが対抗商品が全くなくなると
e.Typistが手抜きし始めるから形だけでも残ってもらった方がいいな。

395 :名無しさん@お腹いっぱい。:2006/09/30(土) 17:19:00 ID:nUtd3U1F0
読取革命がある


396 :386:2006/09/30(土) 18:12:14 ID:ZJPKuVam0
>>390
日立超LSIシステムズのMY-QREADERってやつで\398,000。
ちなみにソフトだけじゃなく専用のPCIボード込みなのでピーコも_。
専用ハードによる文字認識でPenII 300MHzが主流の時代の代物なのに高速だった。
もっとも今はCPUが速くなったのでソフトだけでも十分なんだけど。

397 :名無しさん@お腹いっぱい。:2006/09/30(土) 21:34:12 ID:NBV4N4H80
ダメもとでお聞きしますが、Mac対応でフリーのOCRソフトなんてありませんか。
それが無ければ、1万円を切るソフトはありませんか…?
Mac対応版はWin対応のよりも倍ぐらい高いんですよね、どれも。OTL

398 :名無しさん@お腹いっぱい。:2006/09/30(土) 21:39:43 ID:iNUp/IlD0
WinReaderProを仕事用に検討していますが、どなたか使われた方いらっしゃいますか?
20万円もするので気楽には買えませんので。。。

399 :名無しさん@お腹いっぱい。:2006/10/01(日) 03:25:19 ID:6ixnYLr20
>>398
仕事で使うものの情報を
こんなところで集めるのはやめろよ・・・
自分で調べた方が安全

400 :名無しさん@お腹いっぱい。:2006/10/01(日) 09:53:48 ID:WvMARitI0
>>399
PC関係の情報は2chが一番早いので。
仕事で使っているソフト、ハードの情報はほとんど2chで入手しました。
嘘の情報はそれなりにわかりますしね。2chか価格コムで調べて買うというのが多いですね。

401 :名無しさん@お腹いっぱい。:2006/10/02(月) 02:32:58 ID:yT4SsxAOO
俺は日立の帳票マスター使ってるよ

402 :名無しさん@お腹いっぱい。:2006/10/02(月) 05:41:51 ID:ZYOoziFL0
smartが一番

403 :名無しさん@お腹いっぱい。:2006/10/05(木) 19:57:23 ID:aY7Ko/8j0
SmartOCRってまだどっかから手に入れられたりできない?

404 :名無しさん@お腹いっぱい。:2006/10/06(金) 14:23:58 ID:ArovS4cU0
>>403

つttp://ocr.rossa.cc/

405 :名無しさん@お腹いっぱい。:2006/10/06(金) 15:56:47 ID:6Bl0QuR70
>>404
リンク切れ?

406 :名無しさん@お腹いっぱい。:2006/10/07(土) 02:59:04 ID:e9AUhQqs0
うお、レイアウトがw

407 :名無しさん@お腹いっぱい。:2006/10/07(土) 10:20:48 ID:104t2KLp0
リンクきれてるな

408 :名無しさん@お腹いっぱい。:2006/10/07(土) 17:19:03 ID:oro3A3sc0
filecache.deあぼーんでsmartocrオワタ\(^o^)/

409 :名無しさん@お腹いっぱい。:2006/10/07(土) 17:35:15 ID:opPB5pDv0
\(^o^)/


410 :名無しさん@お腹いっぱい。:2006/10/08(日) 03:51:16 ID:3kDvU2pq0
俺持ってるから関係ないや

411 :名無しさん@お腹いっぱい。:2006/10/08(日) 18:08:49 ID:N8NhqxEI0
ビジネスソフト板にも尾crすれがあった

412 :名無しさん@お腹いっぱい。:2006/10/08(日) 18:17:19 ID:LMMEjzcE0
OCRを使ってますか?
ttp://pc8.2ch.net/test/read.cgi/bsoft/1141402809/

413 :名無しさん@お腹いっぱい。:2006/10/20(金) 17:49:29 ID:3UV/yuu60
ほすす

414 :名無しさん@お腹いっぱい。:2006/10/20(金) 19:30:32 ID:XhCLS0YF0
ソース糞ソフトから本格読取2がでるよ

415 :名無しさん@お腹いっぱい。:2006/10/21(土) 21:32:53 ID:x+s51qZ50
ttp://www.sourcenext.com/titles/use/74150/
読取革命9改か・・・どこを「仕様変更」したか気になるところだ。

416 :名無しさん@お腹いっぱい。:2006/10/21(土) 21:34:17 ID:oeD+LEUh0
名前とか。
他のソフトが付いてたなら、それも削られてる。辞書も多少削られてるかも。


417 :名無しさん@お腹いっぱい。:2006/10/22(日) 11:26:53 ID:XHAMoIGg0
読み取り革命体験版インストして、期間が来たからアンインストしたけど
アドイン解除してアンインストしたのに、ワードに読み取り革命のメニューが残ったまま。
どうやって消せばいいの?

418 :名無しさん@お腹いっぱい。:2006/10/23(月) 00:28:04 ID:geo80Ohm0
C:\Documents and Settings\USER_NAME\Application Data\Microsoft\Word\STARTUPか
C:\Documents and Settings\USER_NAME\Application Data\Microsoft\AddInsに
なんかそれっぽいのあったら消せ

419 :名無しさん@お腹いっぱい。:2006/10/23(月) 07:14:35 ID:kQ6qEoy70
以前、WinReader PRO(バージョンは6)を使って、高額なソフトでもこれでは実用に
絶えられないなと思って、OCRはまだまだだと思っていたが、最近出た、読んでココ(バージョン12)
を使ってみて、偉いOCRソフトもかなり進化したなというのを感じた。
しかし、既存のPDFの認識精度はかなりのものがあるが、スキャナーから読み込んだもの
に関しては、まだまだ実用の域には達していないと思った。
当方が扱う、法律関係の文章での話しで、通常のビジネス文章なら、そこそこ修正すれば
使えるのかもしれないが。

420 :名無しさん@お腹いっぱい。:2006/10/23(月) 07:17:04 ID:kQ6qEoy70
>>398
OCRは仕事に使うには、まだまだだと思います。修正する手間を考えると、
大人しくPDFファイルないしは、紙媒体でのコピーが確実です。

421 :名無しさん@お腹いっぱい。:2006/10/24(火) 09:03:43 ID:f/S+mxkS0
>>419
WinReaderPROていまver10だよね。
どうだろうね?

422 :名無しさん@お腹いっぱい。:2006/10/25(水) 19:49:57 ID:BG1ZUYK90
今来た過去ログ読んだ

SmartOCR欲しい・・・

423 :名無しさん@お腹いっぱい。:2006/10/26(木) 07:12:56 ID:GXHptwKo0
>>422
ヒント:ocr.rossa.cc

424 :名無しさん@お腹いっぱい。:2006/10/26(木) 08:03:57 ID:E4aP431G0
>>422
君性格くらいね
スパイウェアを広めるのはいくない

425 :Nomu:2006/11/03(金) 22:23:36 ID:iUKc4B5G0
スキャン画像にOCRを掛けて透明テキスト付きPDFを作成するところ
までは出来ています。実際、検索も可能になっています。
さて、元のデータがExcelやWORDなどで、そこから直接PDF化したものは
元の文字をテキスト選択ツールで選択できますが、
OCRで透明テキストの場合は、テキスト選択ツールで選択できるように
するのは無理でしょうか。
なお、TouchUpなどで無理やり透明な文字をかぶせる技もあるでしょうが、
そういう余計な手数は掛けずに、行える範囲での前提とします。

426 :名無しさん@お腹いっぱい。:2006/11/03(金) 22:45:22 ID:6588JCgI0
>>425
コテハンうざい

427 :名無しさん@お腹いっぱい。:2006/11/03(金) 23:00:51 ID:z32n03Yy0
PDFの透明テキストとOCRは関係ない
帰れ

428 :名無しさん@お腹いっぱい。:2006/11/03(金) 23:11:29 ID:tSrIGytR0
やってみてから書き込め、ボケ

429 :名無しさん@お腹いっぱい。:2006/11/04(土) 00:16:36 ID:ZktZmkOe0
  そういう余計な手数は掛けずに、
  行える範囲での前提とします。
   ̄ ̄ ̄)/ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
     ( ^ω^)       ∧_∧
    /     \    (    )ハァ? 何言ってんだこいつ
.__| |    .| |_ /      ヽ
||\  ̄ ̄ ̄ ̄   / .|   | |
||\..∧_∧    (⌒\|__./ ./
||.  (    )     ~\_____ノ|   ∧_∧
  /   ヽ 氏ねよ      \|   (    )
  |     ヽ           \/     ヽ. オマエ馬鹿だろ
  |    |ヽ、二⌒)        / .|   | |

430 :名無しさん@お腹いっぱい。:2006/11/05(日) 11:58:49 ID:Bnn8beJe0
  ( ゚д゚)      「そういう余計な手数は掛けずに、行える範囲での前提とします。」・・・
_(__つ/ ̄ ̄ ̄/_
  \/    /
     ̄ ̄ ̄

  ( ゚д゚ )
_(__つ/ ̄ ̄ ̄/_
  \/    /

  ( ゚д゚ ) ガタッ      
  .r   ヾ
__|_| / ̄ ̄ ̄/_
  \/    /

 ⊂( ゚д゚ )
   ヽ ⊂ )
   (⌒)| ダッ
   三 `J

431 :名無しさん@お腹いっぱい。:2006/11/05(日) 18:39:47 ID:Iiq9SX+t0
>>430
こっち向かって走ってくんなw

432 :名無しさん@お腹いっぱい。:2006/11/08(水) 20:38:44 ID:3HKpT8rw0
パナソニック、認識精度が向上したOCRソフト「読取革命Ver.11」
http://pc.watch.impress.co.jp/docs/2006/1108/pana.htm

433 :名無しさん@お腹いっぱい。:2006/11/20(月) 02:48:19 ID:UlfEHxa00
読取革命もルビの扱いをなんとかしてくれないことには何とも。

434 :名無しさん@お腹いっぱい。:2006/11/21(火) 21:16:46 ID:vrsLPcFX0
ライブPDFとsmartOCRって同じ作者じゃね?

435 :名無しさん@お腹いっぱい。:2006/11/29(水) 11:17:23 ID:zSFqDqCI0
http://www.sourcenext.com/titles/use/74170/
入力可能な画像ファイル形式:
ico,

これってアイコンファイルだよな?
これをテキスト化する状況が思い浮かばんのだがw

436 :名無しさん@お腹いっぱい。:2006/11/29(水) 14:20:16 ID:nreIeUGR0
ライブラリィが対応してるので、わざわざ読めないようにする方が手間かかるだけだろ

437 :名無しさん@お腹いっぱい。:2006/11/29(水) 16:04:41 ID:lWCW+zBj0
435はケチをつけたいだけでしょ


438 :NNN:2006/12/09(土) 01:02:01 ID:2/wxd38Y0
読んde!!ココを使っているが認識してワードで表示する際、文字列をいくつかのテキストボックスで
区切って表示するせいでいちいちコピーしなくてはならず余計に手間がかかるのですが
テキストボックスで区切らせない方法orテキストボックスを一気に解除する方法ってないのですか?

439 :名無しさん@お腹いっぱい。:2006/12/09(土) 13:18:39 ID:u6P8MIbS0
ワードのVBA使え


440 :名無しさん@お腹いっぱい。:2006/12/09(土) 13:20:36 ID:u6P8MIbS0
マルチかよ・・・

441 :名無しさん@お腹いっぱい。:2006/12/10(日) 14:57:22 ID:uMaBJc8r0
           -‐-      ,、
       __〃      ヽ lv !
       ヽ\ .ノノノ)ヘ))〉ヽ'   / ̄ ̄ ̄ ̄ ̄
     _!(0.)! (┃┃〈リ /   < はいっ!
   /\ Vレリ、" lフ/ ./ \   \_____
  /  ./l ̄ ̄ ̄ ̄ ̄ ̄ ̄|ヽ
  \/l  |―――――――! ヽ
      l  | ○ み か ん  |
      l  l―――――――|
.      \l_______|

442 :名無しさん@お腹いっぱい。:2006/12/14(木) 10:40:39 ID:7AK0d3kH0
メディアドライブのHP、なんで見られないんでしょうか?

443 :名無しさん@お腹いっぱい。:2006/12/22(金) 08:26:12 ID:dGNQhmqY0
復活しているよ

444 :名無しさん@お腹いっぱい。:2007/01/05(金) 00:57:29 ID:EeadamAd0
本格読取2、精度良いね。俺の手持ちのドキュメントでは、読んでココより精度がよかった。
1980円以上の価値はあると思う。

445 :名無しさん@お腹いっぱい。:2007/01/07(日) 11:58:38 ID:dRvUQxjL0
>>444
読取革命V9そのままらしいからな。対値段比で考えると相当いい。
ただ英文がやたら弱くないか?
日本語だけの文章なら精度いいんだが、英語が混じると悲惨なことになる。

446 :名無しさん@お腹いっぱい。:2007/01/12(金) 16:11:17 ID:9w4xHvEE0
SmartOCR1.07を常用していたが、透明テキストつきpdfにする場合解像度の設定において勝手に文字の大きさ基準でサイズを変えてしまう。
したがって、(別なソフトで)複数のpdfを連結した場合、元が同じ大きさの原稿でもAdobeReader上では場合によって違う大きさ表示になってしまう。
今までは1画像→1pdfにしていたから問題にはならなかった・・・・・orz

で、とりあえず読んdeココ12無料体験版を使ってみたのだが・・・・・自動認識の認識率が非常に悪い・・・・こうも違うものなのか?
読んdeココは、(白地に黒のただの文書原稿ならどうか知らないが)文字と絵や写真をふんだんに使ったカラフルな画像は苦手のようだ。


447 :446:2007/01/13(土) 08:13:51 ID:txbwSWm00
>>446のサイズが変わる件、自己解決。
○○○、捨てないでとっておいてよかった。

今回、色々体験版を使ってみたが・・・ずいぶん認識率に差があるな。
今回使った原稿では、S>e>>>>>ry だった。
とくに、ある特定の文章において文字認識(95%以上の認識率)ができるソフトと、どう設定を変えても文字認識できなかったソフトがあるのはびっくりだった。

448 :名無しさん@お腹いっぱい。:2007/01/13(土) 18:25:01 ID:ZKON0N9L0
英文OCRエンジンを搭載してるかどうか

449 :446:2007/01/13(土) 20:49:48 ID:txbwSWm00
>>448
>>447に対してかな?
ならば・・・・対象文章の詳細。
現物は、黒に近い灰色の地に縦書き日本語白抜きのゴシック文字で2.2mm角位。
それを360dpi bmpファイルにして読ませた。
この文字の他、カラーを使った図や表が沢山あったのだが、Sとeはそれらの図表中の数字(縦2.5〜3mm)も一応読み取ってくれたが、他2はry

もっと高解像度で試せという声が聞こえてきそうだが・・・
印刷の関係上画像ファイルは360dpiでほぼ統一してあり、現物がすでにないファイルも沢山あるので、俺にとっては360dpiでないと意味はない。

450 :名無しさん@お腹いっぱい。:2007/01/14(日) 22:06:26 ID:gDvAo02g0
デフォルトの精度よりも
使い勝手で選んだ方がいいよ
学習させないとどれも使い物にならないんだし
学習させたらどれも同じレベルになる

たまにしかOCR使わない人ならデフォルトの精度だけで選ぶのも手だけどさ


451 :名無しさん@お腹いっぱい。:2007/01/14(日) 23:27:20 ID:6UO6XDK00
>>450
最初は何をやっても(注)画像としか認識しないのでも、学習により文字認識可能になるのかね?

(注)自動認識だけではなく縦書き横書き・また認識枠を使って強制的な認識を試した。
もちろん、体験版だからちょろっと触った程度である。
でも、各ソフトのスタートラインが違いすぎる。

452 :名無しさん@お腹いっぱい。:2007/01/21(日) 11:01:20 ID:If32Oo320
革体験
 傾き補正・自動の精度が悪い。
 傾き補正・手動の操作性が悪い。

453 :名無しさん@お腹いっぱい。:2007/01/24(水) 17:43:47 ID:ucWpj8mf0
160GB SATAHDDがカッコヨスぎてwarota

キヤンヘ凸−ンはこのFAXを受取られた従業員数1〜400名規模の事業者の方が対象となります。
rl ノ     ■=■            伽凹lTl⊇■:≡:l▲へ′lヨJ■_止□‖亡!■lコ′hザdb■■■
 ′つn M      刑同MR月巳の侍仏洞i肌同ロロりし乗lq
 エロまで!(一部を除く場合かあり打9また本フ・ロモーションの適用は、1′29までにこ注文を頂いた場合に剛打※)
AMDCPU搭載PCDimensionC521今週のおすすめ!発注] ̄ド=19788581
・AMDSempronTMプロセッサ3400+
・WindowsxpHomeEdition正規版
・5†2〃β(512MBxl)DDR2−SDRAMメモリ
.†6∂GβS∧mJのβ
・サムスン製†タインデ丁打液晶モニタ(フサソク)
・内蔵NVIDIAGe†0rCeTM6150LEGPUクーラフイツクス
・DVD−ROMドライブ
・1年間引き取り修理サービス(保守ハD−ツ含む)
・12時間テクニカル電話サポートくE・メールサホ■−ト付)
大容量160GBHDD槻
さらに大画面19’モニ附!

454 :名無しさん@お腹いっぱい。:2007/01/24(水) 18:14:50 ID:ucWpj8mf0
元ネタです。(FAXモデムでダイレクト受信)
http://www.uploda.org/uporg665477.png

みなさんの環境でコレをOCRかけたら、どれだけ正確に取り込めますか?

ちなみに上で試したのは 7年前のソフト 読んdeココVer2.11 全自動です。
いま出回っているソフトを使ったらどれだけ進化してるか興味があります。


455 :名無しさん@お腹いっぱい。:2007/01/24(水) 21:46:12 ID:LSNalub20
>>454
e.Typist V11。自動認識で453までの文章結果。
範囲指定してやればもう少しマシだとは思うが。

>キャンペーンはこのFAXを受取られた従業員数1-400名規模の事業者の方が対象となります。
>1/29要!
>期間限定お得な特別商品のご案内
>(一部を除く場合があります。また本プロモーションの適用は、1/29までにご注文を頂いた場合に限ります※)
>AMDCPU搭載PCDimensionC521今週のおすすめ!
>発注コード
>・AMDSempronTMフロセッサ3400+
>・Windows回XPHomeEdition正規版
>・512ル擢∋(512MBx1)DDR2-sDRAMメモリ
.>160GBSA7酒HDD
>・サムスン製19"チTFr液晶モニタ(ブラック)
>・内蔵NVIDIA回Ge拍rceTM6150LEGPUゲラフィックス
>・DVD-ROMドライブ
>・1年間引き取り修理サービス(保守パーツ含む)
>・12時間テクニカル電話サボート(E・メールサボ.一ト付〉
>大容量160GBHDD搭載
>さらに大画面19,モニタ付1

456 :名無しさん@お腹いっぱい。:2007/01/24(水) 23:08:02 ID:ovSgjl0P0
>>454
読んココ12、いきなり認識させて

キヤンヘe−ンはこのFAXを受取られた従業員数1−4m名規模の事業者の方が対象となります。



期間限定お得な特月
商品のご案内
(一部を隙く場合があります。また本プロモーションの適用は、1/29までにこ注文を頂いた場合に限ります※)

・AMDSempronTMプロセッサ3400+
・Windows@xpHomeEd血m正規版
・512MB(512MBxl)DDR2−SDRAMメモリ
.160GβSA7乃11DD
・サムスン製19ルゲm液晶モニタ(ブカク)
・内蔵NVIDLA@GeforceTM6150LEGPUゲラフィックス
・DVD−ROMトうイブ
・1年間引き取り修理サービス(保守バーツ含む)
・12時間テク二カバ電扇滑ボート(Eメールサポート付)
発注コードこ
州田




9

457 :名無しさん@お腹いっぱい。:2007/01/26(金) 09:32:20 ID:WPLblaIx0
今、読取革命の最新版の体験版使って、縦書きの文章を処理しているんだが。
コピーを繰り返して、人間様は困難があるものの読み取れるが、ソフトの方では判断に迷うような原稿の場合・・・
一括修正で、「首が痛くなる」ぞw

修正前の確認として、縦書きをそのまま左に90度倒したのがたくさん出てくる。
(横書きはそのまま)
個々の似たような文字形を一緒に修正するかどうか選べる。
そこで取捨選択するのは、当然人間様のお仕事。
その確認作業では、文字がかすれていればいるほど、間違いなく読み取るには首を傾ける必要がある。

せめて、どちら向きで表示させるか選べればいいのにな。

458 :名無しさん@お腹いっぱい。:2007/01/27(土) 23:08:02 ID:t4gJ+ZZy0
s

459 :名無しさん@お腹いっぱい。:2007/02/01(木) 23:38:35 ID:of0mcj9v0
>>455 に感動し、e.typistを買うことにした。
実際試用版つかってみたけど、全然優秀だったし。
読んでココだと、tiffのカラー版はよめないとか言われたし・・

460 :名無しさん@お腹いっぱい。:2007/02/02(金) 07:52:29 ID:8CCYdWQc0
e.Typistと読んde!!ココ両方持ってるけど
>459
同意するようなそうでもないような。
誤認識の所を再認識させるのはがやりやすい。
前、試した時は読んde!!ココの方が
元文書のレイアウトに近かった。

461 :名無しさん@お腹いっぱい。:2007/02/10(土) 17:26:39 ID:7v8Omm3H0
ここでSmartOCR

462 :名無しさん@お腹いっぱい。:2007/02/11(日) 19:03:49 ID:CU4bnzbg0
e.typist¥2万か・・・もうちっと安くならんかな・・・

463 :名無しさん@お腹いっぱい。:2007/02/12(月) 01:20:06 ID:ov2QAPy90
>>459
あのまま読み込むのではなく
フィルタかけてからのほうがいいよ
そうすれば広告の認識率に近くなる

464 :名無しさん@お腹いっぱい。:2007/02/20(火) 17:35:07 ID:R0Pvtepc0
>>404
d。これ、Copyじゃない方がいいのかな?

465 :名無しさん@お腹いっぱい。:2007/02/20(火) 17:45:40 ID:R0Pvtepc0
あ、今気付いた。コピーの3つは落としやすくするためと、予備か

466 :名無しさん@お腹いっぱい。:2007/03/06(火) 15:17:55 ID:wiKC1IMb0
あげちょる

467 :名無しさん@お腹いっぱい。:2007/03/11(日) 14:10:41 ID:BmeVkgEa0
現時点で落とせる所キボン

ついでにあげ

468 :名無しさん@お腹いっぱい。:2007/03/12(月) 11:24:47 ID:rV9/0Wky0
>404で普通に落とせるよ。
ダウンロードのリンクが表示されるまでに時間が掛かるだけ。

469 :名無しさん@お腹いっぱい。:2007/03/12(月) 13:20:19 ID:NPUsZQVC0
>>468
ちょwマジだw

ありがと&うp主THX!

470 :名無しさん@お腹いっぱい。:2007/04/03(火) 10:58:15 ID:jcDWAVO40
 

471 :名無しさん@お腹いっぱい。:2007/04/04(水) 23:47:30 ID:5pEd6gF3O
http://itpro.nikkeibp.co.jp/article/USNEWS/20060906/247265/

472 :名無しさん@お腹いっぱい。:2007/04/07(土) 02:59:49 ID:Mb5vzdo40
本格読取2、英語の読み取り精度が悪いと思ったら、辞書自体省かれてたのね・・・
platinum版は初版ベースなの?2ベースなの?

473 :名無しさん@お腹いっぱい。:2007/04/07(土) 11:26:38 ID:k8qrpDmi0
OCRソフトでテキスト化したデータに、
さらに、これ使えば、読み取りミスを発見できるのでは?!

文章校正支援ツール Just Right!2 オンラインカタログ
http://www.justsystem.co.jp/justright/toku01.html

474 :名無しさん@お腹いっぱい。:2007/04/07(土) 16:10:22 ID:3tCIEtVy0
WinReaderPROの 中古版だと安いし2〜3万円のおもちゃより、
認識度はダントツに違う 探せば掘り出し物はある。
図書館から借りてきて、テレビを観ながら自動スキャンして
満員電車の中でパームを使って読んでいる。

 

475 :名無しさん@お腹いっぱい。:2007/04/07(土) 23:33:39 ID:Tk1ABTk/0
スレ違いだけど借りてきた本を自動スキャンってどうやるの?
裁断できないよね?

476 :名無しさん@お腹いっぱい。:2007/04/08(日) 00:17:50 ID:iQtddhHD0
文化の荒廃の序章

477 :名無しさん@お腹いっぱい。:2007/04/08(日) 08:14:55 ID:ilEa/RWS0
>>475
下のどっちか
いずれにしてもお金持ち

http://atiz.com/bookdrive.php
http://www.kirtas-tech.com/index.asp

478 :名無しさん@お腹いっぱい。:2007/04/08(日) 09:09:31 ID:ISzvp7710
ちょっとしたロボットみたいな感じだね

479 :名無しさん@お腹いっぱい。:2007/04/08(日) 12:57:03 ID:tTmtr51s0
1冊300円くらいで画像化してくれる所あるし
そういうの利用してるんじゃないかな。

480 :名無しさん@お腹いっぱい。:2007/04/15(日) 21:45:33 ID:NsGlMjxe0
英文オンリーでOCRソフト使いたいんですが、一番認識率いいのは
どれなんでしょうか。
海外のフリーソフトとかありますかね??

481 :名無しさん@お腹いっぱい。:2007/04/15(日) 22:24:51 ID:Oyanpx/80
値段によってだいぶ違う。
とっつきやすいのは、本格翻訳 SUPER(\2900)についてくるOCRとか。

482 :名無しさん@お腹いっぱい。:2007/04/17(火) 01:11:41 ID:UnFTo7Bd0
>>480
FineReader Pro
二ページ続きの画像を自動分割してくれる。本をOCRして
PDF保存するときに便利。
英語だけだと役不足かもしれない。欧文多言語認識につよい。

483 :名無しさん@お腹いっぱい。:2007/04/22(日) 03:11:18 ID:WC4lxGTB0
縦書きのルビを誤認識しないソフトはありますか?

484 :名無しさん@お腹いっぱい。:2007/04/22(日) 18:39:06 ID:gRg6gkbq0
>>483
体験版を使って判断したら?
やった上での質問なら使ったことのあるソフト名書いてくれ

扱う原稿の状態などによっても違うし一概には言えないからさ

485 :名無しさん@お腹いっぱい。:2007/04/22(日) 22:40:54 ID:H0dJsJl6O
>>484
分からないならスルーすりゃいいのに

486 :名無しさん@お腹いっぱい。:2007/04/22(日) 22:52:32 ID:NTiyhGlr0
つかルビなんて確実に認識できるソフトなんてあるか?

487 :名無しさん@お腹いっぱい。:2007/04/23(月) 00:37:51 ID:4t8hsufJ0
読取革命の体験版使わせてもらってます。
小説をテキスト化しようとすると、
ページのすみのページ数まで取り込んでしまうため
崩れてしまうので選択範囲で囲んで認識するのですが、
これ毎ページごとにしない方法ってあるでしょうか?
上1cmを読み取らないようにしたいのですが……

とりあえずフォトショップで全部切ってから読み込ませようと思ってますが

488 :名無しさん@お腹いっぱい。:2007/04/24(火) 19:33:20 ID:GMXFIsi/0
読取革命はわかんないけど、e.Typistなら読み取り範囲設定する機能があるよ。
読み取り範囲を自動じゃなく手動で設定する場所ない?
矩形で範囲指定して順番も任意に変えられるから、頁数が本文に混じったりすることはうちではないな

489 :名無しさん@お腹いっぱい。:2007/04/24(火) 19:34:13 ID:GMXFIsi/0
補足。一ページごとじゃなくて全ファイルに設定を適用できるという意味

490 :名無しさん@お腹いっぱい。:2007/04/25(水) 17:47:15 ID:72dBCul00
ttp://no722.cocolog-nifty.com/

小説画像再配置ツールのとこ。モバ板で開発されてたけど、公開サイトできた。
画像からOCRするときに、これで先に処理しておくと、本文位置なんかをほぼ正確に
設定できる。
読んde!!ココの枠情報ファイルを使った一括認識でも読み取り枠をかなり精密に
指定できるようになる。

491 :名無しさん@お腹いっぱい。:2007/04/25(水) 20:56:34 ID:1/DHbGJL0
だれか電話帳からひとりでデータベース作った奴居る?
うちの村は人口少ないけど1ページだけで疲れて諦めた。

492 :名無しさん@お腹いっぱい。:2007/04/26(木) 01:43:03 ID:GYa4q+ck0
無差別DB化って、なんか金儲け目的でやってるような気が・・・
マトモな人間ならやらんように思うんだけど

493 :名無しさん@お腹いっぱい。:2007/04/26(木) 01:46:06 ID:aXKryLXTO
>>492
だろうね

494 :名無しさん@お腹いっぱい。:2007/04/26(木) 07:31:38 ID:hsKdtYm00
>>491
手が後ろに回るぞ!
警察に報告しました、逃げるなよ


495 :名無しさん@お腹いっぱい。:2007/04/27(金) 05:48:50 ID:qJ7wVrGj0
>>491
nyで流れてる

496 :名無しさん@お腹いっぱい。:2007/04/27(金) 20:16:56 ID:TyEfRJXl0
>>490
トン
まだ試してないがスクショを見て感動した。
神っているもんだな

497 :名無しさん@お腹いっぱい。:2007/04/30(月) 01:51:22 ID:sLkYqs0k0
>>487
体験版はどうか知らないけど、
適当なページを手動で範囲指定して「テンプレートに保存」
一括認識で「テンプレートを使う」でいける
ただ、全く融通が利かないので注意

498 :名無しさん@お腹いっぱい。:2007/04/30(月) 05:59:12 ID:5pL5s8yV0
>497
>490ので処理すると画像内の本文位置を相当正確に統一できるよ。
読んde!!ココもv12まではテンプレ(枠情報ファイル)で設定した認識範囲は固定だったけど、
v13で自動微調整してくれるようになったみたい。


499 :名無しさん@お腹いっぱい。:2007/05/06(日) 20:41:05 ID:G03gIUz/0
漫画とかの目次の読み取り制度の高いOCRソフトって何?
自炊した漫画に目次とか手打ちしてくの怠過ぎ。


500 :名無しさん@お腹いっぱい。:2007/05/09(水) 13:57:21 ID:99QB49QB0
tes

501 :名無しさん@お腹いっぱい。:2007/05/19(土) 17:34:20 ID:MJYxjg3x0
e.typistのエントリーを持っているのですが、製品版にしようか迷っているしだいです。
エントリー版だと精度優先が選択できず、常に速度優先なのですが、
速度優先と、精度優先はどのくらい違うものなのでしょうか?

502 :名無しさん@お腹いっぱい。:2007/05/19(土) 23:46:09 ID:PB2nZC+o0
スクリプトによる自動読み取りを考えているのですが、
コマンドラインから呼び出せるようなOCRを探してます。

ソフト.EXE < 画像.JPG > 結果テキスト.txt

みたいな感じで読めるソフトありますか?

503 :名無しさん@お腹いっぱい。:2007/05/20(日) 00:19:18 ID:X0rH5ysl0


504 :名無しさん@お腹いっぱい。:2007/05/20(日) 01:06:51 ID:1nypUcOf0
>>501
最新版の体験版が公式サイトにあるから
ダウンロードして試せば?

ちなみに最新版だと
速度優先と精度優先の設定自体無かった様な気がする。

505 :名無しさん@お腹いっぱい。:2007/05/20(日) 01:57:05 ID:fXVBB8f40
>>504
そうしてみます。どうもです。

506 :名無しさん@お腹いっぱい。:2007/05/24(木) 00:05:13 ID:m6D0J+hE0
スレ汚し申し訳ありません。
私、これまでeTypistをつかっていました。
単にキヤノンスキャナについてたというだけのきっかけで
それなりにつかってきました。

この度WindowsをVista化して、
eTypistがいつまでもVista対応にならないので
見切りをつけて「読んde」か「革命」あたりに
乗り換えねばと考えてます。
が、いろいろググったり本スレの過去のカキコを
読んでみても決め手に欠けて選びかねています。

体験版で試せばいいのかもしれませんが、
極力Windows環境を汚したくない気持ちもあります。

和文・英文ともにOCRします。新聞・雑誌の記事が
中心ですが、PDF化されたものも対象、
というのが私の使用状況です。
ヒントいただければありがたく思います。よろしくお願いします。

507 :名無しさん@お腹いっぱい。:2007/05/24(木) 00:07:21 ID:JtoWD+i20
eTypist>>>革命>>>>>>>>よめやここ

508 :名無しさん@お腹いっぱい。:2007/05/24(木) 00:17:03 ID:IP3+408H0
>極力Windows環境を汚したくない気持ちもあります。
あほかw
体験版試したあとOSクリーンインストールでもしろ

509 :名無しさん@お腹いっぱい。:2007/05/24(木) 00:20:54 ID:JtoWD+i20
↑まちがい

↓正解
RegSeeker

510 :名無しさん@お腹いっぱい。:2007/05/24(木) 00:27:13 ID:oQsTBG6L0
>>506
つ[Acronis True Image]

511 :名無しさん@お腹いっぱい。:2007/05/24(木) 00:39:28 ID:2EuU9Ihu0
TotalUninstall

512 :名無しさん@お腹いっぱい。:2007/05/26(土) 20:26:38 ID:95PnN5Qd0
e.typistの12っていつぐらいに出ると予想されます?
11買おうかとも思うんですが、
11は、結構古いんで、買ってすぐ新しいのでたらやだなと思いまして。

513 :名無しさん@お腹いっぱい。:2007/05/29(火) 20:35:52 ID:KKC/xjSJ0
http://plusd.itmedia.co.jp/pcuser/articles/0705/29/news043.html
「本格読取 2 Deluxe」、6月29日発売。2970円。


なんだかんだ言って、また英文OCRは省かれるんだよな。
英文OCR付きプラチナは、いつ電気屋の店頭に並ぶんだろう・・・
参考: http://www.google.co.jp/search?q=%E6%9C%AC%E6%A0%BC%E8%AA%AD%E5%8F%96+platinum

514 :名無しさん@お腹いっぱい。:2007/05/30(水) 21:21:07 ID:pTXU8GzB0
読んdeココ for EPSON Ver.4.07の直リンわかる方いませんか?


515 :名無しさん@お腹いっぱい。:2007/05/31(木) 18:16:10 ID:qsHbord50
>>506
smartお勧め

516 :名無しさん@お腹いっぱい。:2007/05/31(木) 22:33:58 ID:YxAzCzkf0
>>514
スキャナー付属の物ならまずwebに無いだろう

517 :名無しさん@お腹いっぱい。:2007/06/03(日) 14:19:19 ID:RWdiD0XW0
>>514
EPSONのHPにあるよ

518 :名無しさん@お腹いっぱい。:2007/06/07(木) 12:28:22 ID:+k6s2B/y0
>>506
 いま読んでここと、etypsit比べているが、認識制度は日英混在なら読んでここのほうが
ずっといい。etypistはなぜか英語がみんな全角になっちゃうし、単語の切れ目もきちんと
認識できていない。
 読んではインターフェースがイマイチなんだけど、この認識精度の差は埋めがたい。
純英語同士だとあまり差は感じない。

 やっぱり試用して、同じものスキャンしてみるといいよ。

519 :名無しさん@お腹いっぱい。:2007/06/07(木) 13:32:08 ID:c6qqyJBg0
最初の頃は認識精度で選んでたけど
学習させたらどれも大差なくなってくるから
編集しやすいのを選んだ方がいいとおもう。

520 :名無しさん@お腹いっぱい。:2007/06/07(木) 15:48:24 ID:rTQM8Q420
英も自我全角になるのは何の問題も無いだろ。
簡単に直せる市。

521 :名無しさん@お腹いっぱい。:2007/06/07(木) 19:50:55 ID:QT4A944M0
>>518
 自己レス。etypistは、デフォルトの設定から一部変えたら、
英単語がきちんと認識されるようになりました。
これでインターフェースで選んでもOKそうです。

522 :名無しさん@お腹いっぱい。:2007/06/10(日) 12:44:19 ID:Bn9+OI/80
>>521
後続の者のために、どのように変えたら良くなったか書いてくれ

523 :名無しさん@お腹いっぱい。:2007/06/10(日) 21:47:17 ID:O+MyPhJK0
>>522

文字認識のメニューから
 言語を:日本語(英語混在)にする。
 そして、空白文字挿入指定を「空白出力」にする。
これは改行コード指定を「ブロック改行」にするとで
きなくなるので、それ以外の改行コード指定にする。

 いろいろいじっていたので、どの設定がデフォかは
忘れたけど、これをやると英単語の間をきちんと認識する。

 とにかく「空白出力」を有効にすることが必須。

 本文が日本語で、要旨や図の説明が英語になっている
技術論文は、この設定を間違ってしまうと悲惨なことに。



524 :名無しさん@お腹いっぱい。:2007/06/11(月) 22:57:26 ID:fi0mIOzn0
>>523
d

525 :名無しさん@お腹いっぱい。:2007/06/12(火) 21:14:17 ID:TmZVwJCw0
縦書きで、英語部分のみ90度回転(本を横にして読む)してる部分を認識する方法ってあるかな?
読み取り範囲に横書き/縦書きどっちを指定しても画像の上が文字の上と一致しなきゃいけないのは変わらないし、、、
一箇所二箇所なら手打ちで何とかできても、一ページ数箇所とかだと途方に暮れる
ちなみに使ってるのはetypist10です

526 :名無しさん@お腹いっぱい。:2007/06/14(木) 18:16:13 ID:MZzFuaL20
すみません、学術論文をスキャンして、それを画像からテキストに変換したいのですが、
問題は、論文の中にドイツ語やフランス語も入っているということなんですけど、
さすがにドイツ語やフランス語まで認識してくれるOCRソフトはないですよね?

527 :名無しさん@お腹いっぱい。:2007/06/14(木) 20:02:32 ID:/i8UfP/C0
>>526
> ないですよね?
という問い掛けをいやらしく感じるのは漏れだけ?
つttp://www.google.com/search?q=%E5%A4%9A%E8%A8%80%E8%AA%9E+OCR&ie=utf-8&oe=utf-8

528 :名無しさん@お腹いっぱい。:2007/06/14(木) 21:57:48 ID:MZzFuaL20
>>527
いやらしいと思いつつも、回答していただきありがとうございます。
本当に悪意はないのでw
非常に助かりました。

529 :名無しさん@お腹いっぱい。:2007/06/16(土) 00:36:41 ID:d8IXz+hf0
>>525
メジャーな機能じゃないかも
俺が知ってるのは読取革命くらいしか出来ない

>>528
>本当に悪意はないのでw
最後のwもやめたほうがいいよ
「ないですよね?」や「w」が
自然に出てくるようだとちと怖い

530 :名無しさん@お腹いっぱい。:2007/06/16(土) 01:17:24 ID:VQaiHJ1E0
>>529
読取革命できるんだ! 超さんくす
早速体験版落としてくる
OCRってなかなか一ソフトだけじゃすまないよなー

531 :名無しさん@お腹いっぱい。:2007/06/16(土) 12:00:27 ID:Mq2PXuOr0
http://pc8.2ch.net/test/read.cgi/bsoft/996505150/

532 :名無しさん@お腹いっぱい。:2007/06/18(月) 09:30:58 ID:puvoa998O
http://p20.fileseek.net/cgi-bin/p.cgi?uR=ocr.rossa.cc%2F&sZ=
だれか試して

533 :名無しさん@お腹いっぱい。:2007/06/20(水) 10:49:02 ID:JlYS+vI+O
>>532ミスってた
http://ocr.rossa.cc/

534 :名無しさん@お腹いっぱい。:2007/06/22(金) 14:20:21 ID:7iUFwDnD0
試した。
フツーーーのOCRソフトだった。

532=533は何が聞きたかったのかな?

535 :名無しさん@お腹いっぱい。:2007/07/08(日) 22:17:19 ID:WDaFYbIE0
聞いてみて

536 :名無しさん@お腹いっぱい。:2007/07/10(火) 11:00:58 ID:R3FyXrqI0
グーグルブック検索。
検索に使わない数式なども丁寧に直している出版社の方が多いけれど、OCR結果を
全く修正しないで登録している出版社が何社かあるな。「工」と「エ」くらいならかわいい
もので全く意味不明のものもある。著者がかわいそう。

537 :名無しさん@お腹いっぱい。:2007/07/21(土) 16:18:17 ID:e2ZhIFOP0
最近ocrを始めましたがこれってスキャンの解像度が悪いと
影響大きいですか?私の光学解像度1,200×2,400dpi性能では
ほとんどうまくテキスト化できませんでした。
どの程度の解像度が必要でしょうか???

538 :名無しさん@お腹いっぱい。:2007/07/21(土) 16:23:32 ID:e2ZhIFOP0
最近ocrを始めましたがこれってスキャンの解像度が悪いと
影響大きいですか?私の光学解像度1,200×2,400dpi性能では
ほとんどうまくテキスト化できませんでした。
どの程度の解像度が必要でしょうか???


539 :名無しさん@お腹いっぱい。:2007/07/21(土) 16:25:09 ID:e2ZhIFOP0
スレ間違えました。失礼しました。

540 :名無しさん@お腹いっぱい。:2007/07/21(土) 18:11:53 ID:fXjgR9V20
300dpiあれば十分だろ
あとはコントラストとかの問題

541 :名無しさん@お腹いっぱい。:2007/07/22(日) 00:46:45 ID:0rh6CBEo0
300dpiでは低いよ。
400dpi以上。試せばわかるはず。

542 :名無しさん@お腹いっぱい。:2007/07/22(日) 01:00:59 ID:TRo+FmNZ0
文字を拡大すれば問題ない。
マメ本だと400dpiでも無理。

543 :名無しさん@お腹いっぱい。:2007/07/22(日) 04:29:14 ID:9fsxREmx0
300dpiから上は認識率は変わらないと思う。
200dpiと300dpiでもほとんど差がない。
俺の環境(ScanSnapS500でハードカバーや雑誌スキャン)では少なくともそうだ。

認識率に一番響くのは原稿の状態。
汚れていたり黄ばみが酷かったり印刷が悪かったりすると認識率がガタオチ。

「ほとんどできない」ってのは手書き原稿とか
写真背景に文字が刷り込んであるとか
コミックの吹き出しの中とかかな。

200dpi相当くらいまで縮小しちゃった物で構わないので
スキャン画像のサンプルをアップすれば的確な回答が来るのでは?>質問者

544 :名無しさん@お腹いっぱい。:2007/07/23(月) 00:57:09 ID:JoRSkVg70
一般的な印刷物って300dpiではなかったっけ?
だったら300dpiで十分だし、400dpiあればより安心って感じでないか。


545 :名無しさん@お腹いっぱい。:2007/07/23(月) 02:04:22 ID:2Cew43Yn0
よっぽどクセのあるフォントとか文字が小さいとかじゃない限り
300dpiあれば十分

あとは文字がクッキリとコントラスト等が調節できてるかによる

546 :名無しさん@お腹いっぱい。:2007/07/23(月) 03:45:50 ID:lorVcd360
そんな原稿なら手入力した方が現実的だな。

547 :名無しさん@お腹いっぱい。:2007/07/27(金) 09:36:49 ID:BD0S29j10
etypist12はどうですか?

548 :名無しさん@お腹いっぱい。:2007/08/05(日) 01:40:32 ID:5939Ae+P0
Google製の多言語OCRエンジンを搭載した「Softi FreeOCR」
http://oshiete.new-akiba.com/archives/2007/07/googleocrsofti_freeocr.html


でも日本語未対応

549 :名無しさん@お腹いっぱい。:2007/08/29(水) 20:36:32 ID:HhJFBICD0
ここで大人気のSmartOCRってそんなに性能いい?

試しにLiteを使ってるんだけど、いくら学習させてもXを×と誤認識するし、
段組関係はお話にならないレベル。

X1
ってのが
X一になったりするしw

1を右クリックしてもほかの選択肢が出ないし、そもそもの段組の位置が滅茶苦茶。

せめて学習機能が使い物になればエンロールと割り切って使って、
脳みそ鍛えるんだが。

何かいい方法無いかなあ。

550 :名無しさん@お腹いっぱい。:2007/08/29(水) 21:15:24 ID:j//B3kLA0
タダなんだからそんなもんだろ
品質に不満ならe-typistでも買った方が早い

バージョンアップ版は大昔に買ったスキャナに
付いてたのでもOKだし安いからオススメ

551 :名無しさん@お腹いっぱい。:2007/08/29(水) 21:41:29 ID:vQuDIF5d0
ID変わったけど

>>550
e.Typistが一番いい?
読んでココの古いバージョンユーザーなんでうpグレードはこれが一番安いんだが。

質がいいのならそちらに乗り換えます。

メジャー系の全種体験版使って判断すべきだけど、最近のはレジストリ汚しまくりなんで。


552 :名無しさん@お腹いっぱい。:2007/08/29(水) 22:21:48 ID:ne9cS2rk0
背景に画像があるやつ(CDについてる歌詞)を
デフォ設定でやったら読み取り革命が一番まともだった。
まあ学習させてなんぼのソフトみたいだから初期設定って意味ないんかもね

553 :名無しさん@お腹いっぱい。:2007/08/30(木) 02:31:45 ID:YMqPcJox0
学習にあんまり期待しない方がいいかと。
デフォルトでは想定されていないような
一文字のスペースに二文字を突っ込んだような文字とか
(句読点とカッコ類を一文字分スペースにまとめてたり)
そんな感じのはあまり遭遇しない類の例外処理の追加でしかないよ。
ごくごく当たり前の原稿の認識率は上がらない。

色つき背景に対応しだしたのは最近のverからだね。
柄つき背景はまだどこのもぜんぜんだめっぽい。

554 :名無しさん@お腹いっぱい。:2007/08/30(木) 04:17:48 ID:8cX5+Y+i0
背景が英字新聞の場合は?

555 :名無しさん@お腹いっぱい。:2007/08/30(木) 19:34:15 ID:MBF2Q0dn0
553はまともに使ったことなさそうだな


556 :名無しさん@お腹いっぱい。:2007/08/31(金) 19:28:40 ID:X8mRf/wg0
>555
縦書きで、本文とルビを混ぜて1文字として認識しているような場合はどう学習させて、どうすれば
次回似たような情況でうまく判定できるようにできるのか教えてくれ。

557 :名無しさん@お腹いっぱい。:2007/09/01(土) 01:18:08 ID:RaqlnS0/0
>>556
置換すればいいじゃん。

558 :名無しさん@お腹いっぱい。:2007/09/02(日) 00:04:55 ID:/ShAfiy40
>557はまともにOCR使ったことなさそうだな。


559 :名無しさん@お腹いっぱい。:2007/09/02(日) 00:31:24 ID:NVGVE2w40
>>556
話変わってるじゃんw


560 :名無しさん@お腹いっぱい。:2007/09/02(日) 00:33:33 ID:NVGVE2w40
>縦書きで、本文とルビを混ぜて1文字として認識しているような場合
よく分からん
詳しく説明してほしい

561 :名無しさん@お腹いっぱい。:2007/09/02(日) 02:37:28 ID:kK0TPrWk0
>>558
OCRなど30年前から使ってるが。
ただし真面目には使ってない。

562 :名無しさん@お腹いっぱい。:2007/09/02(日) 08:36:01 ID:S2LE2C0F0
> OCRなど30年前から使ってるが。

認知症ですか。かわいそうに。

563 :名無しさん@お腹いっぱい。:2007/09/02(日) 10:02:13 ID:kK0TPrWk0
>>562
http://inu.ei.meisei-u.ac.jp/~html/ocrweb/ocr3/index.html

564 :名無しさん@お腹いっぱい。:2007/09/02(日) 19:22:06 ID:b21q+l2y0
>>562

かわいそうに。

565 :名無しさん@お腹いっぱい。:2007/09/02(日) 19:46:38 ID:mZ3rWXVo0
>>562
脳内認識エンジンのチューン不足ですか。かわいそうに。

566 :名無しさん@お腹いっぱい。:2007/09/03(月) 20:33:46 ID:CzULmAqY0
>>562かわいそうに。

567 :名無しさん@お腹いっぱい。:2007/09/03(月) 22:36:28 ID:PyWafQ3J0
苛めよくない。

568 :名無しさん@お腹いっぱい。:2007/09/04(火) 06:11:03 ID:UdHs+6dV0
プレイなんだよきっと

569 :名無しさん@お腹いっぱい:2007/09/08(土) 16:53:07 ID:bG+CAb9F0
預金通帳を拡大コピーせずダイレクトにテキスト変換(エクセル等で使いたい)したいのですがうまくいきません。
預金通帳をトライした人いますか?
ちなみに使用ソフトは「読取革命」、スキャナーは300dpiです。

570 :名無しさん@お腹いっぱい。:2007/09/08(土) 19:33:58 ID:6fbD8CNm0
解像度を上げて試してみようと思わないのかねぇ……

571 :名無しさん@お腹いっぱい。:2007/09/08(土) 20:25:51 ID:mRd7ARAC0
>スキャナーは300dpi
って書いてあるからハードウェアの光学解像度上限が300dpiなのでは?
ならばそんなゴミは窓から投げ捨てて新しいスキャナ買え! としか言えない。

572 :名無しさん@お腹いっぱい。:2007/09/08(土) 21:03:57 ID:bG+CAb9F0
>>570,571
レス、サンキュー
正解です。300dpiが限度なのです。
どの位ならいいのでしょうか?

573 :名無しさん@お腹いっぱい。:2007/09/08(土) 21:31:28 ID:qzHioSaW0
画像の前処理が必要なんだと思う。

通帳って紙の地に模様が刷り込んであるよな。
灰色とか黄色とか薄い赤とかで。銀行のマークなんかが。

あれがOCRに読み取られてしまうと滅茶苦茶になるので
その模様をうまく消す画像のレタッチが必要なんだろう。
例えば背景が赤系の模様ならばRGBのRチャンネルだけ真っ白に飛ばしてから
残りの色だけで白黒化し、記帳されている数字だけ残るようにしてやる。

自分で思いつけない人は↑もちんぷんかんぷんかもしれんが
用は画像レタッチの知識が必要です、ということ。

スキャン解像度は300dpiあれば十分だと思うよ。

574 :名無しさん@お腹いっぱい。:2007/09/08(土) 22:21:40 ID:9kXomqHo0
・減色するとき閾値を上げる
・特定チャネルだけを使う(Rが入ってるならBだけとか)


575 :名無しさん@お腹いっぱい。:2007/09/09(日) 04:18:08 ID:Wayz4dwa0
OCRよりお前の目で見た方が遥かに認識能力が高い。
なにもわざわざコンピュータにたよらなくとも
お前にはそれだけの能力があるんだ。
自分にもっと自信をもちなさい。

576 :名無しさん@お腹いっぱい。:2007/09/09(日) 04:25:08 ID:YeApTPNwP
tesseract、3を5と見間違えるんですが
トレーニングで何とかなりますか

577 :名無しさん@お腹いっぱい。:2007/09/09(日) 10:37:07 ID:TJ6TdM9A0
>>573
職業がら200通位×ページ数
データ入力を目視、手入力では、時間が掛かり、転記ミスも発生。
人を雇うほど余裕はない。
画像レタッチ使用すれば黒と白のみと要らないデータは消せる。
しかし必要なデータと同じ色ならその部分のカットしかないし、時間が掛かりそう。
しばらく、考えて見ます。レス、サンキューです。






578 :名無しさん@お腹いっぱい。:2007/09/09(日) 11:32:57 ID:nU6AA3X+0
仕事で継続的にやることがわかってるんならネットバンギング登録すれば?
今時は都市銀でもやってるんだしアグリッパなりなんなり使えばExcelへの流し込みも簡単だろ

579 :名無しさん@お腹いっぱい。:2007/09/09(日) 12:20:35 ID:p37oIG6b0
banging?

580 :名無しさん@お腹いっぱい。:2007/09/09(日) 12:38:40 ID:TJ6TdM9A0
顧客すべてにネットバンキング入れる?
IT弱者の事も考えないのかなぁ?
ソフト使い方、セキュリティとかいろんな問題が出るでしょ。
よけいに手間が掛かるし老人や障害者もいるのでね。
ところでアグリッパ(PDF?)てなんでしょうか?ヒントになるかもしれない。




581 :名無しさん@お腹いっぱい。:2007/09/09(日) 14:08:06 ID:b4CWqVib0
> 顧客すべてにネットバンキング入れる?
> IT弱者の事も考えないのかなぁ?
> ソフト使い方、セキュリティとかいろんな問題が出るでしょ。
> よけいに手間が掛かるし老人や障害者もいるのでね。
> ところでアグリッパ(PDF?)てなんでしょうか?ヒントになるかもしれない。

おまいさんが廃業すればいいんじゃねーの?

582 :名無しさん@お腹いっぱい。:2007/09/09(日) 14:27:05 ID:nU6AA3X+0
スマソ、バンキングね。

>>580
客をネットバンクに入れさせる必要がどこにあるの?
要は取引明細をテキスト化できりゃいいんでしょ?
アンタが使ってる銀行で、アンタの口座をネットでも使えるように登録しとけば
ログインしてPCから明細見れるようになるんだからコピペでExcelに貼っつければいい
相手がどんな方法で振込んでこようが関係ない。

アグリッパは複数の金融機関の明細を一度に参照できるシステムだが
上の手順で済ませるのなら別に必要ない。知りたかったらググって調べろ

583 :名無しさん@お腹いっぱい。:2007/09/09(日) 14:28:52 ID:pF0za8zm0
画像レタッチしなくてもたいがい取り込み時の設定で
カラーバランスやコントラスト弄れるでしょ

必要なデータと背景の色が似てようが濃度や色味
違えば設定でどうにでもなるだろうし

あとはOCRで一番大事なスキャン品質を一定に保つ為
スキャナのパネルに枠貼り付けたりして位置ズレを徹底
してなくす努力だけ

584 :名無しさん@お腹いっぱい。:2007/09/09(日) 15:58:38 ID:6WtPLdEA0
システム作るなら、最初からocrエンジンを借りてきて、画像処理くらい自前で用意するだろ
犯罪のにおいしかしない

585 :名無しさん@お腹いっぱい。:2007/09/09(日) 16:09:19 ID:TJ6TdM9A0
あ、スマン、
顧客の日々の取引(入金、出金 残高、相手先)
のデータ作成を請け負っている仕事なので
ぜんぜん自分の口座と関係ないので乙。
カラーバランス、コントラスト いろいろやってみますね。
レス ありがd。




586 :名無しさん@お腹いっぱい。:2007/09/09(日) 21:00:43 ID:XLgeQDJm0
http://www.sii.co.jp/cp/products/english/sre8000/dictionary.html

587 :名無しさん@お腹いっぱい。:2007/09/09(日) 22:55:58 ID:0TmXydc30
既存の会計ソフトで通帳や出納簿に特化したOCRができるものもあるみたいだぞ。
ってかプロなのかyo
ドシロウトの俺が「会計 通帳 OCR」と検索してあたりがつけられるようなことを
知らないのってやばいんでねーの。

588 :名無しさん@お腹いっぱい。:2007/09/09(日) 23:20:35 ID:TJ6TdM9A0
これでしょ。
実際に拡大コピーしないとダメだったのですが・・・。
http://www.z-irazu.jp/product.php

589 :名無しさん@お腹いっぱい。:2007/09/10(月) 23:46:17 ID:tLXqJKXQ0
>>588
>>571

590 :名無しさん@お腹いっぱい。:2007/09/11(火) 08:00:32 ID:Homl5X9v0
> 顧客の日々の取引(入金、出金 残高、相手先)
> のデータ作成を請け負っている仕事なので
> ぜんぜん自分の口座と関係ないので乙。

頭足りてないなら、とっとと廃業するべきだ。

591 :名無しさん@お腹いっぱい。:2007/09/22(土) 12:38:33 ID:IN/2021F0
e.typist12.0で ルビを文中に挿入を選択して文庫本をスキャン>認識すると
一部の行が左端の最後の行に重複して表示されてしまうのですが
どう対処したらよいのでしょうか?

592 :名無しさん@お腹いっぱい。:2007/09/25(火) 17:38:23 ID:Pnv4wn/K0
>591
たぶん傍点なんかで起きる現象と同じじゃないかな。結果のテキスト見ると複数の文章が混ざって
しまってる状態。
認識時に文章が赤くマークされるけど、こういうのが起きるときは赤いところが反転して白くなる。
それを見て、ファイル名をメモしておいて、あとから修正モードで傍点を削除してから別途認識
してる。それしか対処の方法はなさそう。
傍点が大量になければ、テキストになった段階で修正するだけ。

傍点以外でも、一部のルビ、ゴミ、……なんかで起きることもあるみたい。
ルビなしで傍点が大量にあるんなら、ルビは無視してしまうと思う。e.Typistの傍点挿入位置は
いつでもずれてるから。

593 :名無しさん@お腹いっぱい。:2007/09/28(金) 00:49:01 ID:kO0WhpSR0
>>575
んまあ、人間の脳って余分な作業も多いのか基本的に遅いからね
OCRに関してはまだ信頼性が微妙だからどの道人目チェックは必要だが
それでも手入力で全部やるよりはOCR+人手チェックの方が早い

と、マジレスしてみる

594 :名無しさん@お腹いっぱい。:2007/09/28(金) 02:22:27 ID:FG/hllZY0
>>593
お前は自分の能力に自信を無くしている。
しばらく山へ篭って自分を取り戻すべきだ。

595 :名無しさん@お腹いっぱい。:2007/09/28(金) 06:42:17 ID:JinZJTny0
ダイバダッダの魂宿りますた。
世界平和のために無償労働するっす。

596 :名無しさん@お腹いっぱい。:2007/09/30(日) 05:12:31 ID:fVlDcJAE0
>職業がら200通位×ページ数

これ見ると、ふつうの稼業じゃあないな
かたぎなら弁護士、司法系、税務・会計系か
やばいのなら斗一か事務所だな、と考えてみる。
だが、>>585か 税務資料か

「読取革命」、スキャナーは300dpiです → 最新版にする、解像度は最低400dpi(最新本ソフトの最低要件)でスキャン


597 :ご参考まで:2007/09/30(日) 05:50:09 ID:fVlDcJAE0
旧ヴァージョン アップデート(以下からたどる):
ttp://panasonic.co.jp/pss/pstc/products/yomikaku/old.html

最新版(V1.1.1)の特長:
・FAX文書などのかすれ文字にも強い日本語OCRエンジン
・レイアウトをそのまま再現
・縦書き・横書きテキスト、画像、図などが混在した原稿も、レイアウトをそのままに再現
・複雑な表の罫線やセルの背景色も、再現、また、認識結果で得た数字を数値としてExcelに出力でき、そのまま計算式に使用可
・英数字の一行手書き文字にも対応し、品番やメモ書きなどの手書き文字を認識

解像度 50〜2,400dpi(400dpiを推奨)
>>596を一部訂正

ttp://panasonic.co.jp/pss/pstc/products/yomikaku/index.html
体験版(10日間)DL:
ttp://panasonic.co.jp/pss/pstc/products/yomikaku/demo.html

598 :名無しさん@お腹いっぱい。:2007/10/01(月) 23:00:54 ID:ZJSIv2Sr0
記帳代行で乙。

599 :名無しさん@お腹いっぱい。:2007/10/03(水) 02:48:08 ID:lW4nXSBZ0
>>598
ご本人は正にその仕事をされているように思うのだがw

600 :名無しさん@お腹いっぱい。:2007/10/03(水) 03:30:28 ID:5xTbDZcD0
名簿データ取り込み?

601 :名無しさん@お腹いっぱい。:2007/10/03(水) 04:51:39 ID:9DUfmmoQO
http://imepita.jp/20071003/110220

602 :名無しさん@お腹いっぱい。:2007/10/03(水) 05:07:51 ID:ZwtirfFY0
下は簡単なCaptcha画像ですが、
http://ja.wikipedia.org/wiki/%E7%94%BB%E5%83%8F:Captcha.png
ランダムな線が入っていたり、色が違っていても認識出来るような
ソフトは無いでしょうか?

603 :名無しさん@お腹いっぱい。:2007/10/03(水) 07:43:43 ID:nJglqY7H0
犯罪者乙!

604 :名無しさん@お腹いっぱい。:2007/10/03(水) 09:58:49 ID:lW4nXSBZ0
>>600
んや、税務会計関係

605 :名無しさん@お腹いっぱい。:2007/10/03(水) 13:07:59 ID:La1Wx76N0
>>602
スパム業者死ね

606 :名無しさん@お腹いっぱい。:2007/10/03(水) 23:56:14 ID:H4AdpPJY0
キャプチャってcaptureじゃなかったっけ

607 :名無しさん@お腹いっぱい。:2007/10/03(水) 23:59:02 ID:H4AdpPJY0
あー、全然別もんなんだ。俺が悪かった

608 :名無しさん@お腹いっぱい。:2007/10/12(金) 22:47:53 ID:SrJh6grm0
office2003に入ってる「microsoft office image document」が、
すごく使いやすかったんだけど、office2007になったら無くなってるね。
2003から持ってくることは出来ないのかな。

609 :名無しさん@お腹いっぱい。:2007/10/13(土) 17:16:36 ID:nepRO5lX0
読取革命だが、2つの文字を1つと間違えてしまう問題を学習機能によって解決できるの?
解決できるソフトはある?

610 :名無しさん@お腹いっぱい。:2007/10/13(土) 17:39:44 ID:GAhJKdKe0
学習機能は文字だけでしょ


611 :名無しさん@お腹いっぱい。:2007/10/14(日) 06:29:53 ID:VQe2G2hR0
間違えるのも認識するのも全て文字だけだが?

612 :名無しさん@お腹いっぱい。:2007/10/19(金) 13:49:13 ID:Ziv6Jg4J0
SmartOCR liteeditionのヘルプキャッシュってどこかにない?
com経由で利用したいんだけどまったく資料がなくてイミフ。
よろしくたのんます。

613 :名無しさん@お腹いっぱい。:2007/10/21(日) 12:42:36 ID:YC+r/lRo0
今現在 読取革命のVer.7を使って 英文と画像しかない物をスキャンかけてるんだけど
大体ミスが1ページにつき10文字位あるんだけどこれってVer.11 にすればもう少し改善される?
あとVer.11の方はアクティベーションあったりする?

614 :名無しさん@お腹いっぱい。:2007/10/21(日) 13:20:42 ID:zf4XBilV0
>>613
原稿の精度に左右される。
[K]ものだなw
悪知は無かったと思う(あってもクリア)
検証後DELしてしまったので

615 :名無しさん@お腹いっぱい。:2007/10/21(日) 17:28:13 ID:YC+r/lRo0
>>614
一般的な英語のテキストに対して使ってます
[K]もの? 体験版?それともクラックのことでしょうか?


616 :名無しさん@お腹いっぱい。:2007/10/24(水) 10:50:55 ID:S7BJ2he10
613
10文字ぐらいだったら、たいした手間じゃないからそのままでいいんじゃないの
それが5文字になったとしてもあまり変わらないような気がする


617 :名無しさん@お腹いっぱい。:2007/10/24(水) 17:12:22 ID:PvY78B8J0
>>613
英語のOCRはよほどスキャン状態が悪くなければ
単語DBとの照合なんかもしてくれるので
99.99%くらいの認識率まで行ってると思う。

英語圏のソフトの最新体験版を試してみては?

618 :名無しさん@お腹いっぱい。:2007/11/08(木) 01:17:26 ID:kSzZVbgV0
原稿にもよるけど英語OCRもまだまだ改良の予定があるよ。
段組なし(1ブロック)、フォント1種類、スタイル1種類、
罫線類なし、みたいな原稿だったらかなりの精度が出るけど、
そういう原稿って実際はあまりないし。

OCRが持ってる綴り辞書との照合もオートでやらせちゃうと
後で間違いを発見するのがかえって難しくなるので、結局
フラグがたったものを1つずつ確認してくしかない。


619 :618:2007/11/08(木) 01:24:35 ID:kSzZVbgV0
>>618
>改良の予定があるよ。

(正)改良の余地があるよ。

620 :名無しさん@お腹いっぱい。:2007/11/09(金) 04:45:42 ID:kwRwnBQS0
OCR機能のついたPDFビューア「クセロReader ZERO」
ttp://xelo.jp/xelopdf/readerzero/index.html

621 :名無しさん@お腹いっぱい。:2007/11/21(水) 00:51:16 ID:4YWhz3M30
>>620
http://xelo.jp/xelopdf/readerzero/spec.html
ここを見ると、色々制限あるな

622 :名無しさん@お腹いっぱい。:2007/11/24(土) 16:52:47 ID:vQJ6YjAl0
期間中にクリック数の一番多い国が優勝
http://www.clickclickclick.com/default.asp


623 :名無しさん@お腹いっぱい。:2007/11/24(土) 17:45:26 ID:/M81SGwoP
>>622
独自OCRなんてあるんだ。。。

624 :名無しさん@お腹いっぱい。:2007/12/10(月) 03:27:04 ID:oguiPK7L0
紙にある表の枠を、
Excelで再現させるのは何のソフトがおすすめですか?

625 :名無しさん@お腹いっぱい。:2007/12/10(月) 05:33:02 ID:hQNhfr3P0
特打

626 :名無しさん@お腹いっぱい。:2007/12/10(月) 15:20:26 ID:mc4o5/AO0
簡単フォーム

627 :名無しさん@お腹いっぱい。:2007/12/10(月) 16:48:47 ID:gWDyiZys0
兆安い


628 :名無しさん@お腹いっぱい。:2007/12/22(土) 22:02:42 ID:aoTjNDiZ0
>>621
制限がファイル単位ってのは実はかなり緩いんじゃないか?
SmartOCRは制限は無かったけどページ単位でしか処理できなかったからなあ
こいつなら必要なファイルを一括してPDFに変換してそれを一気に処理させれば良さそう
精度うんぬんはまだ試してないから分からんのだけど

629 :名無しさん@お腹いっぱい。:2007/12/26(水) 12:05:39 ID:rr6NJUoQ0
上のほうでocr.rossa.ccのスパイウェアの話題をしてましたが...
ダウンロードボタンを押したけど、直ぐにブラウザ閉じた。
スパイウェア貰っちゃったかな?
大丈夫ですかね?

630 :名無しさん@お腹いっぱい。:2007/12/26(水) 15:31:38 ID:ieaMIqGT0
あそこからリンクしてるSmartOCRLite107.zipの中身は
ウェブ魚拓で2006年4月26日 02:44(日本時間)に記録された http://download.vector.co.jp/pack/winnt/writing/other/SmartOCRLite107.zipの魚拓
と同じ。zipファイル内のSmartOCRLite107.EXEの
CRC32:5e81c645
MD5:929502ab3f674b03e1551893507a0997
SHA-1:20321d496c76a335d649e170100f2f4771be384b

631 :名無しさん@お腹いっぱい。:2008/01/08(火) 01:02:12 ID:tmDGCBY80
ほっしゅ

632 :名無しさん@お腹いっぱい。:2008/01/14(月) 23:05:37 ID:KbHOKl/s0
        /⌒ヽ ,, - ──‐ - 、        
   , < ̄7⌒、_ノ::::::::::::::::::::::::::::::::::::::::::`ヽ       
 /:::::::::::::::乂 ノ:::::::::::::::::::::::::::::::::::::::::::::::::::::::\    
/:::::::::::::>‐7:: ̄::::::::::::::::∧:::::::::ト.:::::::::::::::::::::::::::::::ヽ   
:::::::::/  /::::::::::::::::::::::::/. V::::::|.ヽ:::::::::::::::::::::::::::::::::',.  
//   /::::::::::::::::::::::::/   V:::::.i ヽ.:::::::::::::::::::::::::::::::', 
     ,::::::::::::::::::::::__/.    V::i!::i  ',::::::::::::::::::::::::::::::::i. 
    i:::::::::::::::/ ̄/   `  ',::i',::', ─- 、.::::::::::::::::::::| 
.   |:::::::::::/:::::./ ,      ',.i ' ,、  ∨::\::::::::::::::::::| 
   |::::::::::::::::./  !_      `  \ V::::ヽ::::::::::::::::| 
.   |:::::::::::::::/ /示え、      二_、、 V、::::::::::::::::| 
.   |八::/⌒ / ん;;;;;;;|       /う ヾ、 ',:::::::::::::,  
    |/{ ∧  弋二ソ       |;;乂メ;| | |>k:::::/  
     k ⊥    ̄        弋二ン  /、iヽ/   
.      `‐|       '       ̄  /_ `/   <早くVIPに帰ろうよお兄ちゃん
        `、              メ__/    
         > _   r‐、    /ヾ       
      ,, -''´  |!ヽ| >-- ‐ r<´.         
   rヽ´  /  /       〈ニ ヽ          , -、
   |/ヽ\'  ./| ヽ      У \      / /                かわいいは正義
  ./   \ヽ { ヽ、   ´  /    ヽ ./´γ/ /                 http://afox.2ch.net/news4vip/
 /   /  ヽ\ヽ  ̄` ─'/   |  ∨Y彡ヽ,〈 

633 :名無しさん@お腹いっぱい。:2008/02/05(火) 14:27:51 ID:j7DtTZgo0
本格読取2を購入して使ってみたけど、
さすが値段が安いだけあって辞書やパターン登録しても精度がよくないな。
読取革命11の体験版を使ってみようとインストールしてみたが、起動時にエラーが発生して試せなかった。
e.Typist12の体験版を試したら1日で何故か試用期間が終わった……orz

e.Typistはルビの埋め込みができるので、手持ちの小説をテキストに落とすのには良さそうだけど
もう少し認識率と領域指定を試してみたかったのにな。
手持ちの小説を青空形式でテキストにしている方で、お勧めのOCRソフトってありますか?

634 :名無しさん@お腹いっぱい。:2008/02/05(火) 19:54:01 ID:4B5oC2/T0
>>633
WinReader PRO テキスト作成ならばチョット昔のがいい
pdf作成ならば今のがいいけれど、OSがVistaでなければ安く中古で出回っている
図書館で借りてテレビを見ながらスキャン&テキスト化、約1時間でP250は楽に作成
その後ClieTH55で電車の中やチョットした時間で小説を読んでいる、家中本だらけにならずにすむ
また重い本を持ち歩かなくてすむし、返却も気にしなくてもすむ、今は流行のチョットエコな感じ





635 :名無しさん@お腹いっぱい。:2008/02/05(火) 23:33:02 ID:n6V+PtBt0
読取革命の体験版使ってみたけど何度直しても同じ文字ばっかり間違えて
一向に識字率が上がる気配が無いんですが、仕様ですか?

636 :名無しさん@お腹いっぱい。:2008/02/06(水) 00:01:06 ID:X1PyioH/0
>>635
読取革命は知らんけど
普通はユーザー辞書みたいに
この文字はこうなんだyoって教え込む機能があんじゃねえの?

637 :名無しさん@お腹いっぱい。:2008/02/06(水) 01:29:31 ID:ZvtDlRuB0
そういう機能があっても、間違えるものは間違えるのが読み取り革命

638 :名無しさん@お腹いっぱい。:2008/02/06(水) 14:55:56 ID:nDxnu5rf0
>>634
すまんが値段の段階で無理だ……
なにか方法を考えてみるよ。

639 :名無しさん@お腹いっぱい。:2008/02/06(水) 22:27:32 ID:yNcr4Ry/0
結局、読取革命はあきらめた。使う側のことがぜんぜん考慮されて無さ杉。
テンプレート一回一回あてさせるつもりか?しかも数行おきに認識されるってどーよ

それにしてもe.Typistの精度には驚いた。

640 :名無しさん@お腹いっぱい。:2008/02/07(木) 02:16:50 ID:mZYJX8l40
アドビAcrobat PRO CS3に付いているOCRはどうですか?


641 :名無しさん@お腹いっぱい。:2008/02/09(土) 13:22:11 ID:kx6Thi940
>>633
小説用途に限った場合の話だけど

e.Typistは比較的領域判定が優秀なのでほとんどの場合は自動でおk
小説再配置ツールやeTilTranで文字領域を切り出すだけで十分すぎるほど
認識率は読取革命よりはだいぶ上
ただ、感嘆符や――、……、ーのような記号をよく間違えたり読み飛ばしたりする
まれに同じページを不完全な状態で二重認識する(上半分だけとかそんな感じで)
ここがネック

ユーザー辞書は読取革命で何回教えても治らなかった経験から、全く使っていない
後で間違えやすい文字だけ一括置換してる

642 :名無しさん@お腹いっぱい。:2008/02/13(水) 20:01:46 ID:PDD8kYVFO
英単語帳を読み取ってエクセルのデータにして
P‐STUDYシステムに問題集として読み込ませようと思っているのですが
英単語帳にむいているOCRソフトってありますか?

643 :名無しさん@お腹いっぱい。:2008/02/13(水) 20:04:16 ID:zrpzYaHV0
>>641
規制されていたので、お礼が遅れました。
e.Typist12を購入して使っています。
おっしゃるように! ――、ー、一あたりの誤認識が多いですね。
…に関しては点線処理の縦点線ありにしたら、かなりよくなりました。
一括置換も100個が限度という所からエディタでするようにしました。
なかなか難しい所ですね。

644 :名無しさん@お腹いっぱい。:2008/02/28(木) 09:23:33 ID:NWfNaQSi0
保守

645 :名無しさん@お腹いっぱい。:2008/03/04(火) 22:44:36 ID:I6sGMd1z0
e.Typistでルビの部分の行を本文として処理してしまうことがたまにある。
eTilTranで傾き補正はかけた後なんだけど、これって解決する方法ないのかな?

ex)
正解:黄昏(たそがれ)が迫(せま)る道を

誤認識:たそがれ  せま
      黄昏が迫る道を

646 :名無しさん@お腹いっぱい。:2008/03/07(金) 00:49:49 ID:i9ecjhLU0
読取革命12、買おうかな。

647 :名無しさん@お腹いっぱい。:2008/03/07(金) 21:40:57 ID:jfB3M2/r0
読取革命12と読んdeココ13を単行本の読み取りで比較してみたけど、読んdeココの方がよかった。
読取革命は文字以外の部分を無理矢理、認識しようとして意味不明の文字列を連発する。
読んdeココは認識できないものはスッパリ諦めて無視する傾向がある。
この方がむしろ修正の手間がかからないから楽なんだよね。

648 :名無しさん@お腹いっぱい。:2008/03/10(月) 09:02:26 ID:1MG90Ymy0
そうかもしれないね。
でも読取革命のがしがし読む感じがいいんだよね(笑)
まあまとまったゴミを消去する機能があってもいいよね。

649 :名無しさん@お腹いっぱい。:2008/03/21(金) 11:14:49 ID:usFTg7Jp0
以前から疑問だったんだが・・・
スキャナとかコピーとかしたとき、
原稿の一部だけ、字がにじんだり、潰れたりするのは何が原因なの?
途中で動いたってことなのかな?
しっかり押さえたつもりで、自覚症状が無いことがほとんどなんだが。

650 :名無しさん@お腹いっぱい。:2008/03/21(金) 14:03:36 ID:vs8oaQ7S0
>>649
そうだと思います。
やっぱり、カード類なんかはプラスチックで滑りやすいんで、画像が
ボケたり、片側だけが広がったりしてますね。


651 :名無しさん@お腹いっぱい。:2008/03/22(土) 22:33:23 ID:26pq4wpB0
読んでココ13を使い始めたばかりの者です。
英文混じりの書籍を認識させるとき、小文字のc,o,sが頻繁に大文字に認識されます。
候補文字から修正してると自動的にユーザー辞書に追加されていきますが、
このまま同じ文字ばかり追加していって、認識率は上がるのでしょうか?
まだそれほど認識速度は落ちていませんが。
ほかにもっと上手いやり方がありますか?

652 :名無しさん@お腹いっぱい。:2008/03/22(土) 23:31:46 ID:B1KQW1w80
読取革命liteからver.12へのバージョンアップ、インストールがうまくできないのですが、この場合liteにver.12が上書きされることになるのですか?

653 :名無しさん@お腹いっぱい。:2008/03/24(月) 11:50:59 ID:Sg3HQnEQ0
ライトも12も残るよ。

654 :名無しさん@お腹いっぱい。:2008/03/24(月) 21:33:37 ID:RpC75rJB0
>>653
652です。レスありがとうございます。何度インストールしても辞書の読み込みに失敗、ということになり、どうやらliteインストール後にマイドキュメントをDディスクに移動させたのが原因ではないかと。Cに戻してから再度やってみます。

655 :名無しさん@お腹いっぱい。:2008/03/24(月) 23:38:54 ID:RpC75rJB0
>>653
辞書ファイルも、ライトと12と両方残るのですか?

656 :名無しさん@お腹いっぱい。:2008/03/25(火) 10:13:15 ID:UKwYieMD0
>651
それ以上認識率は変わらない。やりすぎると重たくなるだけ。
むしろ、テキスト出力して正規表現置換で小文字にしてしまうほうが
簡単じゃないかな。

657 :名無しさん@お腹いっぱい。:2008/03/25(火) 20:01:55 ID:6dsHcr8U0
当然残るよ。

658 :名無しさん@お腹いっぱい。:2008/04/02(水) 18:09:26 ID:PsFZJM1O0
etypist使っとけ

659 :名無しさん@お腹いっぱい。:2008/04/06(日) 18:08:29 ID:O2A1ix0/0
>>548
プリンタ付属の古い読んde!!ココ パーソナル(Ver.4.01)を使ってたが,
英文の認識だとこっちのほうがいいね

660 :名無しさん@お腹いっぱい。:2008/04/07(月) 13:46:50 ID:d5ef102Q0
eTypistて透明テキストつきpdfで出力できないの?


661 :名無しさん@お腹いっぱい。:2008/04/08(火) 10:20:28 ID:/9Ax63ok0
pdfをrtfかodfに変換する時に使えそうなのない?

662 :名無しさん@お腹いっぱい。:2008/04/09(水) 18:14:29 ID:wF5n2yAm0
つadobe acrobat

663 :名無しさん@お腹いっぱい。:2008/04/10(木) 11:21:55 ID:0U+ttj0K0
>>660 可能
>>661 e.typistで可能
http://mediadrive.jp/products/et/index3.html

664 :名無しさん@お腹いっぱい。:2008/04/10(木) 15:03:50 ID:pNf6kXbz0
読んでココでpdfを読み込むと、一から画像をOCRしてしまって、
元の透明テキスト情報は無くなってしまうのな?
元の透明テキストをそなまま読み込んで、修正のために、
テキストエディタ的な使い方って出来ないものかな?

665 :名無しさん@お腹いっぱい。:2008/04/11(金) 23:10:11 ID:Gt2UltzU0
画像ビューワとテキストエディタを左右に並べればいいだけでは?

666 :名無しさん@お腹いっぱい。:2008/04/11(金) 23:10:57 ID:Gt2UltzU0
画像ビューワじゃねーや
PDFのビューワな

667 :名無しさん@お腹いっぱい。:2008/04/13(日) 03:10:25 ID:CMPBLWQF0
それが器ホンダが、図とか写真とかレイアウトとか書式を設定したりするのが面倒くさいだろ。

668 :名無しさん@お腹いっぱい。:2008/04/13(日) 05:37:43 ID:C/qukH7P0
>>667
それのどこが「テキストエディタ的な使い方」なんだ?

669 :名無しさん@お腹いっぱい。:2008/04/13(日) 21:11:39 ID:CMPBLWQF0
テキストエディタ的って誰が言ったんだよ?

670 :名無しさん@お腹いっぱい。:2008/04/14(月) 11:14:54 ID:dJXYpbuD0
>>664
つadobe acrobat

671 :名無しさん@お腹いっぱい。:2008/04/15(火) 21:11:34 ID:3OAKXwi90
>>669
おまえ話の見えない奴だな〜

672 :名無しさん@お腹いっぱい。:2008/04/16(水) 01:45:53 ID:TQ1X288s0
>>664
使うソフトを間違えてる
OCRは画像をテキスト化するソフト
PDF関係のソフトをあたるのが正解

PDF作成・変換ソフト。Part 5
http://pc11.2ch.net/test/read.cgi/software/1200771165/

673 :名無しさん@お腹いっぱい。:2008/04/23(水) 21:47:14 ID:q2B+fOBS0
英文しかない場合は、外国産の方が認識率高いの?
ヨンデココがどうもダメ、領域を正しく抽出する所から
ちゃんとやってくれない、かすれてないのに。
ネットで落としたものだから、コピーし直すとか出来ない。

674 :名無しさん@お腹いっぱい。:2008/04/24(木) 08:00:33 ID:34xibooz0
>>673
SmartOCRLこれは? 文字がはっきり写ってるなら 高確率で認識してくれるよ?

675 :名無しさん@お腹いっぱい。:2008/04/24(木) 10:21:13 ID:LqECzoR50
>>673
ちゃんと英語モードにしてからやってる?

676 :673:2008/04/25(金) 20:14:31 ID:SRLFiK0c0
一応、漢字は無し、英文字記号数字のみの
設定で読み込ませてはいます。
あとSmartOCRはぐぐってみたけど、
サイトが閉鎖してました。

677 :名無しさん@お腹いっぱい。:2008/04/27(日) 16:15:02 ID:lWgL7JQt0
>>676
SmartOCR - フリーウェアのOCRソフト
http://ocr.rossa.cc/

678 :名無しさん@お腹いっぱい。:2008/04/27(日) 19:31:23 ID:8zNLeoOp0
エクセルファイル⇔一太郎ファイル⇔ワードファイル
が出来るフリーソフトありませんかね?
一太郎で作った表を自動計算させたいのでエクセルファイルに変えたいのですが・・・。
ご存知でしたら教えていただけないでしょうか?

679 :名無しさん@お腹いっぱい。:2008/04/27(日) 20:09:38 ID:gFFqjIH80
ttp://q.hatena.ne.jp/1058864683

680 :名無しさん@お腹いっぱい。:2008/04/27(日) 22:14:55 ID:gVL4KMxz0
>>673
ABBYY社のFineReaderの最新版使うといいよ。
お試し版もあったはず。以前試してみて認識率の高さに感動した。
読んdeココも一応ABBYY社のエンジン使ってるけどたぶん古い。

681 :名無しさん@お腹いっぱい。:2008/04/27(日) 23:06:11 ID:D4XQ9+0+0
ソフト形式を変換とかじゃなくて表の(ハイパー?)リンクだけで出来そうだが

682 :蕪木ら某 ◆Googl8RmwA :2008/04/28(月) 04:38:47 ID:kpMp0cZ40
>>678-679>>681
+ http://faq.justsystem.co.jp/faq/1003/app/jsfaq.jsp?49876+0397
 http://faq.justsystem.co.jp/faq/1003/app/jsfaq.jsp?50406+0397
 http://faq.justsystem.co.jp/faq/1003/app/jsfaq.jsp?49258+0397
 ...
 http://faq.justsystem.co.jp/faq/1003/app/jsfaq.jsp?49036+0397#a02
 ...
 http://pc11.2ch.net/test/read.cgi/bsoft/1200988045/
 ...

683 :名無しさん@お腹いっぱい。:2008/04/28(月) 08:03:53 ID:KHm4WEpd0
>>682
はいはい かしこいかしこい
なにもしなくても一太郎だけでできますよっと

684 :名無しさん@お腹いっぱい。:2008/05/06(火) 12:37:25 ID:TWTA7jP10
読んでココで認識結果をpdf出力するとき、
認識結果は透明テキストに反映されるわけだが、
2行を1行に間違えて認識してしまった場合、
上の行にしか貼り付けされないのな。
結果編集で改行入れても、その行は無いことになってしまう。
認識段階または結果編集段階で行を挿入できないのだろうか?


685 :名無しさん@お腹いっぱい。:2008/05/14(水) 14:04:19 ID:LzErthzGP
>>680
英文なら認識率いいのか…日本語の認識率の悪さに辟易したが。

686 :名無しさん@お腹いっぱい。:2008/05/14(水) 17:49:48 ID:nAAoVTJI0
だって文字の数や複雑さからして違うっていう

687 :名無しさん@お腹いっぱい。:2008/05/21(水) 15:12:27 ID:3tPMVg6y0
購入した本や図書館で借りた本を、OCRソフトで
テキスト化して個人的にノートパソコンかPDFで使用は、
著作権の違法に当たりませんか、またこの本を第三者に売却したら?

688 :名無しさん@お腹いっぱい。:2008/05/21(水) 15:34:52 ID:IB0cb+yL0
どう考えても売却はマズいだろ

689 :名無しさん@お腹いっぱい。:2008/05/21(水) 15:37:22 ID:3tPMVg6y0
図書館で借りた本はいいのかな

690 :名無しさん@お腹いっぱい。:2008/05/21(水) 16:06:43 ID:rcBGeT790
個人的な使用ならおkじゃ?
コピーとるのと同じでしょ

691 :名無しさん@お腹いっぱい。:2008/05/21(水) 16:34:23 ID:3tPMVg6y0
理屈ぽっくてすみません
友人から借りた多くの本でも

692 :名無しさん@お腹いっぱい。:2008/05/21(水) 19:23:56 ID:xmMzdCDf0
>>691
理屈の前に日本語勉強しる

693 :名無しさん@お腹いっぱい。:2008/05/23(金) 02:21:36 ID:dy5Q840K0
>>692
便所の落書き2chに何を興奮してんだよ、
変な物見てんじゃないぞ

694 :名無しさん@お腹いっぱい。:2008/05/23(金) 08:39:24 ID:qndHTxug0
>>687
借りた本を売ったらいかんだろ
ってのはともかく、
自分で買った本なら別に法には触れないだろ。

695 :名無しさん@お腹いっぱい。:2008/05/24(土) 16:45:05 ID:zkuID2AP0
PDF画像からテキストに変換で色々調べて準備終わった。
いざ実行してみるとPDFに画像コピー禁止の権限が・・ ヽ(`Д´)ノ オレノジカンカエセー

696 :名無しさん@お腹いっぱい。:2008/05/25(日) 01:29:44 ID:aA4ZumvxO
e.Typist ver.12を使ってみたんだけど、ルビを埋め込み設定にしたにも関わらず、認識結果は埋め込みとそのままが表示された。
ver.11だと普通に埋め込みのみなんだけど、原因がわからん。
設定同じなんだけどなぁ。なんか設定いじくる必要があるのかな。
どなたか解決策ご存じありませんか。

697 :名無しさん@お腹いっぱい。:2008/05/27(火) 01:48:16 ID:/mEeoUdB0
>>695
互換PDFビューアの過去バージョンで権限無視でコピーできるって話が昔あったような。


698 :名無しさん@お腹いっぱい。:2008/05/29(木) 03:56:45 ID:uFnsPlIH0
ビジネス書とかの単行本をテキスト化してるが、
e.Typist>>読んdeココ>>>>>>>>読取革命
だな。
読んdeココは多機能で使いやすくてバランスが取れた製品だと思うけど、
純粋に文字認識の精度だけを比べるとe.Typistが一番優れてる。

699 :名無しさん@お腹いっぱい。:2008/06/03(火) 23:17:38 ID:mqE/evSE0
>>680
ABBYY社のFineReaderはスゴイ
日本語化出来ないんだろうか?

700 :名無しさん@お腹いっぱい。:2008/06/03(火) 23:47:39 ID:WQ9oBg400
>>699
e.typistと比べてどっちが認識率が高い?

701 :名無しさん@お腹いっぱい。:2008/06/04(水) 02:49:03 ID:0YcMkrT10
>>700
英語ならFineReader、日本語ならe.Typistに決まってるだろ。

702 :名無しさん@お腹いっぱい。:2008/06/06(金) 08:28:43 ID:St1jBd+t0
FineReaderってOmnipageよりいい?

703 :名無しさん@お腹いっぱい。:2008/06/06(金) 15:13:42 ID:bjY5yxxP0
いい場合も悪い場合もある
http://www.ocrreview.com/

704 :名無しさん@お腹いっぱい。:2008/06/14(土) 03:46:01 ID:3uX8P8rx0
>>703
このサイト初めて見た。認識率だとやっぱりOmniPageが優れてるね。
FineReaderもそれに近い値だけど、時間も遅いので、なんだかこれを
使うメリットがにくい。


705 :名無しさん@お腹いっぱい。:2008/06/23(月) 21:24:23 ID:fdvf+v9p0
警察は宗教に目を光らせている、盲信によって罪悪感のない犯罪を
起こしやすい、教祖の出来不出来でその人の人生が決まる

教祖だけに罪はない、似たもの同士がお見合いするのかも知らない、
騙す人間が悪いが、騙される人間も同類か


706 :名無しさん@お腹いっぱい。:2008/06/23(月) 22:00:12 ID:KvQHOAny0
これまた激しい誤爆だな。

707 :名無しさん@お腹いっぱい。:2008/06/24(火) 00:35:24 ID:kDEQN6+m0
>>705
OCR誤認識がひどいな。


708 :名無しさん@お腹いっぱい。:2008/06/25(水) 08:59:23 ID:DKou2GCA0
読んでココはpdf出力するとき、追加保存が出来ないんだな。
wardやhtmlならできるのに・・・
仕方ないから新規ファイルで保存した後、いちいちpdfエディタ立ち上げて
結合させてるけど、マンドクセ。

709 :名無しさん@お腹いっぱい。:2008/06/25(水) 15:04:00 ID:OJ8SNbTv0
見開き表示とか綴じ方(右から左)の設定もできないから不便だよね。

710 :名無しさん@お腹いっぱい。:2008/06/30(月) 17:17:28 ID:nNrhDlkb0
ominipage 16が$79.99で買えるキャンペーン中

http://www.digitalriver.com/promo=212017


711 :名無しさん@お腹いっぱい。:2008/06/30(月) 19:37:06 ID:5LpB7fyT0
>>710
↑クレカの番号と所有者名を収集してるんか?
トップページに行けないぞ?

712 :名無しさん@お腹いっぱい。:2008/06/30(月) 19:38:03 ID:5LpB7fyT0
Domain Name: NUANCESTORE.COM
Registrar: NETWORK SOLUTIONS, LLC.
Whois Server: whois.networksolutions.com
Referral URL: http://www.networksolutions.com
Name Server: PDNS1.ULTRADNS.NET
Name Server: PDNS2.ULTRADNS.NET
Name Server: PDNS3.ULTRADNS.ORG
Name Server: PDNS4.ULTRADNS.ORG
Status: clientTransferProhibited
Updated Date: 16-oct-2006
Creation Date: 01-feb-2006
Expiration Date: 01-feb-2009

713 :名無しさん@お腹いっぱい。:2008/06/30(月) 19:38:43 ID:5LpB7fyT0
Registrant:
Digital River, Inc.
9625 W. 76th Street
Eden Prairie, MN 55344
US

Domain Name: NUANCESTORE.COM

------------------------------------------------------------------------
Promote your business to millions of viewers for only $1 a month
Learn how you can get an Enhanced Business Listing here for your domain name.
Learn more at http://www.NetworkSolutions.com/
------------------------------------------------------------------------

Administrative Contact, Technical Contact:
Digital River, Inc. hostmaster@digitalriver.com
9625 W. 76th Street
Eden Prairie, MN 55344
US
952-253-1234 fax: 952-253-8497


Record expires on 01-Feb-2009.
Record created on 01-Feb-2006.
Database last updated on 30-Jun-2008 06:31:44 EDT.



714 :名無しさん@お腹いっぱい。:2008/07/01(火) 08:23:46 ID:AL20YzVU0
はあ?
ieでもsafariでもいけるよ

715 :名無しさん@お腹いっぱい。:2008/07/09(水) 09:25:33 ID:tqR/hLP70
手書きの文字が認識できるOCRソフトってありますか?

716 :名無しさん@お腹いっぱい。:2008/07/25(金) 18:03:44 ID:nsfqqXyN0
TextSS

717 :名無しさん@お腹いっぱい。:2008/07/31(木) 12:46:10 ID:KkyDCbb60
文字じゃなくて、表などの枠線をスキャナから認識ってできますか?

718 :名無しさん@お腹いっぱい。:2008/07/31(木) 14:14:49 ID:kYKcm3m90
できます
http://jp.fujitsu.com/group/fct/services/archive/ocr/

719 :名無しさん@お腹いっぱい。:2008/07/31(木) 23:49:10 ID:mcLkMUjo0
>>717
e.Typistってのを使ってるけど、できますん

720 :名無しさん@お腹いっぱい。:2008/08/01(金) 10:40:29 ID:DLLVnu+y0
>>718
終了だから"できた"でつね

721 :名無しさん@お腹いっぱい。:2008/08/07(木) 00:06:40 ID:BSuE1Slo0
SubRipでbmp化した字幕データをテキスト化したくて、
読んでココv9と最新体験版、革命v12、タイピストv12、
スマートライトを試しました。スマートライトは画像読むだけで落ちるので
インストールに問題があったようなので別として、のこりでも、
見事に一文字たりとも認識されません。おまけにココだと、解像度エラー
といわれてしまいます。
吸い出し時に設定を変えてみましたが、白地に黒縁かその逆かはともかく
フチ付きの絵になり、それが誤認識の原因ではないかと考えていますが、
あまり自信がありません。どういう手順で、またどんなソフトを使って
(bmpは1500あるので、ひとつずつ開かなくてすむように)色などの
調整を試すのがよいか、どなたか教えてくださいませんでしょうか?

722 :名無しさん@お腹いっぱい。:2008/08/07(木) 18:58:58 ID:eM6AkDyu0
前に画像処理ソフトで処理してから読み込ませた方がいいかも。

ネガ反転や、解像度変更、ノイズ除去、余白やいらない部分の削除、カラー画像であればグレースケールや白黒画像に変換など、

一括処理できるソフトもたくさん有りますから、やってみるといいかもね。



723 :名無しさん@お腹いっぱい。:2008/08/13(水) 00:32:22 ID:IzZ40ACA0
どうしても小文字(ぁぃぅぇぉやゃゅょなど)が弱い
どこのソフトも駄目だ

724 :名無しさん@お腹いっぱい。:2008/08/13(水) 09:31:08 ID:v6VOgDwN0
e.Typist ver12買ってOCR作業中。
正 。 → o・O・0・0 これは許す。すっごいイヤだけど難しいだろうから。
正 I →1 これも当然許す。すっごい難しいだろうから。英語領域にしていすればかなり改善するし。
正 - → 1・I これはなに? なにしてるの? バカなの?('A`)

725 :名無しさん@お腹いっぱい。:2008/08/13(水) 09:36:20 ID:QnPzfkJy0
>>724
OCRにマジになるとか時間の無駄

726 :名無しさん@お腹いっぱい。:2008/08/13(水) 12:13:34 ID:jZK0Tj450
>>724
そんなに嫌なら文字種いじれよ

727 :名無しさん@お腹いっぱい。:2008/08/14(木) 04:33:00 ID:bB/191pD0
設定が悪いんじゃないの(笑)

728 :名無しさん@お腹いっぱい。:2008/08/14(木) 10:08:20 ID:+Lwt0Ob70
同じくeTypsit使ってるけど、ScanSnapでPDFに→OCR→透明テキスト付きPDFにすると画像がかなり劣化する。
Scan直後のPDFの画質を守る方法ってないのかな?(´・ω・`)
Acrobat Pro持ってるけど、画像が劣化したあとのPDFを編集しても意味ないよね…

729 :名無しさん@お腹いっぱい。:2008/08/14(木) 16:13:43 ID:BarBaXMw0
透明テキストつけるだけなのに
画像が痛むのか

730 :名無しさん@お腹いっぱい。:2008/08/14(木) 17:14:00 ID:yeyKQnnw0
OCRソフトのpdf入力は一端仮想プリンタに出しちゃって画像にして
文字認識してから改めてpdfに仕立て直してるからな。

最初からjpgでスキャン出力してそれをOCRソフトにかけるか
pdfにしちゃってたものは一度画像として書き出してからOCRソフトにかければいい。

731 :名無しさん@お腹いっぱい。:2008/08/14(木) 22:51:59 ID:d+q5/K3K0
実家にある本でもテキスト化してみるかと思って読んでココの体験版入れてみたけど
使い方もわかんねえし、結構めんどくさいんだな
小説なんかをちゃんと設定してやると誤認識1ページにどれくらいになるの?

732 :名無しさん@お腹いっぱい。:2008/08/15(金) 02:20:36 ID:UA5Ln4AC0
きちんとやればほとんどご認識なんかないよ。
どうしても読めない漢字とかってあるけど。
たとえば解像度600dpiとか、試しにやってみれば。


733 :名無しさん@お腹いっぱい。:2008/08/15(金) 06:10:09 ID:3bwMrQBM0
読んdeココのOCRファクトリー便利だぜ。
一度設定すればアイコンをダブルクリックするだけで全部自動でやってくれる。

734 :名無しさん@お腹いっぱい。:2008/08/16(土) 21:12:32 ID:BBpdl85r0
>>731
元の本のフォントと組版、スキャンの解像度にもよるけど
最良の時で大体1〜2頁に1字前後
酷いと1頁に10字以上とかあるね

1頁に誤字一字の割合だと読でてかなり気になるレベルだから
結局全編目を通して修正することになるね

735 :名無しさん@お腹いっぱい。:2008/08/17(日) 10:35:23 ID:EfKqQDE+0
e.Typist使ってみたけど、たまに一文字を勝手に分離して認識してしまう。
「え」が「、」と「λ」とかになる。
二文字に認識してるから学習しようがない。
細い所とかかすれるとだめ。
まだまだって感じだなあ。

736 :名無しさん@お腹いっぱい。:2008/08/17(日) 21:14:50 ID:NNvDk3xe0
何様だよw

737 :名無しさん@お腹いっぱい。:2008/08/17(日) 21:44:41 ID:a9bB+bqN0
読んでココの開発者だろ

738 :名無しさん@お腹いっぱい。:2008/08/18(月) 01:00:46 ID:v0mRsvdB0
>>732
ああ普段使わないからスキャナの設定なんか全く見てなかったわ
画像データだけ持ってきたけど、だめかもシンネ

OCRファクトリーでまとめて読み込んだ後って読んでココ上で誤字とか確認してる?
画像勝手に追いかけてくれるし、学習しなきゃだけど、エディターが使い

739 :名無しさん@お腹いっぱい。:2008/08/19(火) 14:17:41 ID:m4W/W6650
読んでココを試用してますが、
原稿では2行になってるはずなのに、1行の文として認識してしまい、
わけ分からない文字列を出してくるとき、これを2行に修正することは出来ませんか?
ただテキストを起こすだけなら、認識結果画面で改行して手打ちすれば良いだけですが、
当方、画像が重要な資料を扱ってるため、PDFで透明テキストで貼り付ける必要があり、
ただ改行しただけでは、透明テキストにはその追加した行が反映されていないのです。


740 :名無しさん@お腹いっぱい。:2008/08/19(火) 14:32:14 ID:pZKp1XtT0
AcrobatってOCRソフトとしてどんなもんなんだろう?
アカデミック版Standardで1万ちょいだから買ってみようかな?

741 :名無しさん@お腹いっぱい。:2008/08/19(火) 14:37:27 ID:9YTtEXub0
AcrobatのOCRは糞
よんでここ>>e.typist>読み取り革命>>>>AcrobatOCR

742 :名無しさん@お腹いっぱい。:2008/08/19(火) 20:34:17 ID:aPjCwCOs0
acrobat ocr≒ヨンデココ

ヨンデココ工作員市ね

743 :名無しさん@お腹いっぱい。:2008/08/19(火) 22:10:18 ID:ThYcLLsW0
e.Typist>読んでココだろ。

744 :名無しさん@お腹いっぱい。:2008/08/20(水) 11:54:34 ID:5xCLDVVM0
e.TypistのHP見てきたけど、
取り込んだ画像の補正機能について何も書いてないようなんだが、
見開きの傾き自動補正とか出来るのかな?

745 :名無しさん@お腹いっぱい。:2008/08/21(木) 02:30:37 ID:VsRH2oEP0
ここにはe.Typist使ってる奴はいないってことか

746 :名無しさん@お腹いっぱい。:2008/08/21(木) 10:04:41 ID:piDQE/Jd0
5cm身長アップが50m身長アップになった
これで俺も51m56cmだぜ

747 :名無しさん@お腹いっぱい。:2008/08/21(木) 12:47:35 ID:Q0h/A3Xy0
>>744
見開き手動補正はできる。
自動の傾き補正は見開きには対応してない。

748 :名無しさん@お腹いっぱい。:2008/08/21(木) 15:39:21 ID:Gdf1OOpi0
>>747
そっかー手動なのか。
こういうのは機械任せがありがたいんだけどなー。
サンキュー

749 :名無しさん@お腹いっぱい。:2008/08/21(木) 17:31:48 ID:ksXciaP30
smartOCRはいつも「事」を「夢」と認識する
後からテキストエディタで一括修正した方がいいのか

750 :名無しさん@お腹いっぱい。:2008/08/24(日) 06:25:03 ID:h6cmS6A40
>749
認識辞書で対応すべきではある
「夢」と「事」じゃ、正規表現使ってもまともに修正するのは難しいし、
一括置換すると間違ってないところまで間違えてしまいかねん、一つ一つ
修正するのはどっちもそれなりの数がありそうだから面倒

>745
e.Typistも読んdeココも使ってる。
個人的な感想としては、OCR結果を縮小してあるような画像だと、e.Typistのが
認識率はかなり高い。画像がでかくなるほど両者の認識率は近づいていくけど、
OCR直後のでかい画像だと読んdeココのが多少いいような気はする。

>739
不可能だな。1文字の区切りがきちっとできている状態で、それがどの文字なのかを
学習させることは可能だが、1文字の範囲がどこからどこまでかは学習させようが
ない。本文とルビをごっちゃにして1文字にしてしまうような場合と同様で、ずっと
以前からこういう状態だから、技術革新がないと無理じゃね

751 :名無しさん@お腹いっぱい。:2008/08/24(日) 09:59:49 ID:rHvUrtQk0
>>750
ピントのずれた、無駄に長い、タイミングの悪いレス、どうもありがとう。


752 :名無しさん@お腹いっぱい。:2008/08/24(日) 10:12:44 ID:MGOLjeef0
別にずれてないんじゃね

753 :名無しさん@お腹いっぱい。:2008/08/24(日) 10:58:32 ID:b29yVzjt0
正解率99% ネット認証技術、書籍のデジタル化に威力
ttp://www.asahi.com/science/update/0823/TKY200808230207.html

754 :名無しさん@お腹いっぱい。:2008/08/25(月) 17:48:36 ID:5eaoBiak0
うーん、99.1% ってほぼ自動ってのにはまだまだ程遠いね・・・

755 :名無しさん@お腹いっぱい。:2008/08/25(月) 18:00:07 ID:GHGOAqBa0
つかこれ英語限定じゃないの

756 :名無しさん@お腹いっぱい。:2008/08/25(月) 18:50:29 ID:kMvnDz2o0
人間の正解率てのは元々どのくらいなんだろうな。
俺なんて入力ミスもしてたんだろうが再入力の経験が何度もあるぞ。
人力OCRだから英語以外は対象地域を絞らないと無理だろうね。

757 :名無しさん@お腹いっぱい。:2008/08/25(月) 20:00:55 ID:JUspXpDS0
>>753
結構いいアイデアだな。
日本語だと厳しいが、まあ2chとかの日本語コミュニケーション限定サイトに
置くなら何とかなるかもしれん。

・・・と書いてて今気付いたんだが、難読文字を読んで貰って、それが正しいかどうかの
答え合わせは誰がやってるんだ?
読んだ結果が正しいと判って、それで初めて認証として成立するんだろ?

758 :名無しさん@お腹いっぱい。:2008/08/25(月) 22:11:40 ID:pBM6iPT60
>>753
よくこんなこと思いついてしかも実行したよなww

759 :名無しさん@お腹いっぱい。:2008/08/26(火) 11:13:56 ID:3pII43Sm0
>>757
二つのOCRで一致した部分は正解、ちがった部分は不明として
正解と不明が含まれたものを表示して入力させ
正解の部分は認証として使い、不明部分を入力結果から拾う

とかかね

760 :名無しさん@お腹いっぱい。:2008/08/29(金) 05:58:38 ID:PUHS2H7P0
多数決

761 :名無しさん@お腹いっぱい。:2008/08/30(土) 16:48:15 ID:UobhjFbi0
ケツ多数

762 :名無しさん@お腹いっぱい。:2008/08/31(日) 00:12:15 ID:xOEiIMAi0
どんなに正答率が上がったところで人による目視チェックは必須だろう。

763 :名無しさん@お腹いっぱい。:2008/09/07(日) 09:56:23 ID:9RYOriMs0
>>762
>人による目視チェックは必須

そうです。そしてそこが一番手間と時間がかかる部分。

上に出てたAcrobatのOCRはこのプロセスがないし、埋め込まれた
透明テキストを後から修正するのも事実上困難(不可能では
ないが、OCRソフトでオンタイムに修正していくような訳にはいかない)。
一カ所でも間違いあると困るというOCR作業もあるでしょうが、そうでない
場合には割り切って使うと便利とも言える。特にScanSnapとの組み合わせ
で大量の文書を処理する時など。

OCRエンジンも7で読んde! ココ(の世代落ち)になってるが、8や9で
どうなってるのか分からない。

764 :名無しさん@お腹いっぱい。:2008/09/10(水) 11:38:25 ID:H8/lfHgO0
OCR使ってて感じるのは、誤変換の原因はほとんど「切り出し間違い」。
文字列に占める空白の割合なんかから一意に決めてるんだろうけど、
カスレの多い原稿だと区切るところがめちゃくちゃ・・・
きっちり区切りなおせば正しく認識できるのに・・・
ユーザー辞書や単語認識かけて文字列にならないときとか、
この切り出しを見直して再認識処理してくれないのかね?
処理時間がべらぼうにかかりそうだけど。

765 :名無しさん@お腹いっぱい。:2008/09/10(水) 12:42:49 ID:8eNIWm0W0
GPUで処理できるようになったら何でも有りになるな。

766 :名無しさん@お腹いっぱい。:2008/09/10(水) 18:20:58 ID:8r86j5IT0
読んでココ使ってるんだけど、「〜」が認識されず空欄になってることが多い。
ユーザー辞書にも1文字だけど登録してるのに。何とかならないのかな?

767 :名無しさん@お腹いっぱい。:2008/09/10(水) 18:22:38 ID:aAaEuFR10
>764
小説みたいに同じ大きさの文字が延々と続いているのであれば、文字の大きさを
手動指定するモードとかあっても良さそうだよな。
見出し、本文、ルビの大きさを指定して、そこから文書を解析して認識するのなら
そんなに難しくはないような気もする。新聞とか広告文みたいにいろんな大きさの
文字が混在するのには無力だろうけど

768 :名無しさん@お腹いっぱい。:2008/09/12(金) 17:59:53 ID:BkRq8OtC0
ttp://code.google.com/p/nhocr/
NHocr is a command line OCR (Optical Character Recognition) program for Japanese language

769 :名無しさん@お腹いっぱい。:2008/09/21(日) 20:05:56 ID:CcopwTiy0
素人で失礼ですが
OCRソフトは、10万円以上の価格でないと、7割文字認識できませんか?


770 :名無しさん@お腹いっぱい。:2008/09/21(日) 22:19:11 ID:m2yjq4Bi0
原稿の状態によっては何万出しても変わらない。
認識エンジン自体は1万前後の製品とはそんなに変わらなくて、内蔵辞書を持つとか、そういうところが変わってくる

771 :名無しさん@お腹いっぱい。:2008/09/24(水) 01:41:38 ID:KwoBHrO90
既存のPDFファイル(複合機でスキャン)に透明テキストを乗せようと
読んdeココ!!と読取革命の体験版、クセロReaderZeroを試してみたのですが、
完成後のファイルサイズがとんでもなくマチマチになるのはどうしてでしょうか?
クセロで約3倍、読取革命で約5倍、読んdeココ!!で約17倍にもなってしまいました。

同じ読んdeココ!!で、自動処理ではなく手動で作業を進めていくと
元々のファイルとほとんど変わらないサイズのものができあがるので、
これと同様の処理をなんとか自動でしてもらえたらいいのですが。

772 :名無しさん@お腹いっぱい。:2008/09/24(水) 09:25:41 ID:NU0TD4QW0
複合機の一部では、カラーやグレイスケール画像をJPEGの数分の1に圧縮するものがある

OCRで画像を読んで保存するときに、
1 読み込んだ画像を通常のJPEGで保存→ファイルサイズが数倍に
2 元の高圧縮画像のまま保存→ファイルサイズは元のまま

というケースに遭遇したことがある。今回のケースに当てはまるか分からんが。

773 :名無しさん@お腹いっぱい。:2008/09/24(水) 15:57:00 ID:j94B8AKB0
ソフト(と手順)によっちゃ画像をビットマップに展開して
再度圧縮してしまう場合もある

OCRソフトって文字認識に関しては強くてもPDFや画像の
扱いがなんでここまで糞なのってのが多い

774 :名無しさん@お腹いっぱい。:2008/09/24(水) 16:30:47 ID:NU0TD4QW0
非可逆圧縮で何度も圧縮・伸張したらひどいことになるんじゃ...
と思ったら手動の場合はちゃんとやっているのか

775 :名無しさん@お腹いっぱい。:2008/09/24(水) 18:09:51 ID:v43+h7ws0
いったい何を言っているんだ?

776 :名無しさん@お腹いっぱい。:2008/09/24(水) 20:46:29 ID:j94B8AKB0
>>774
結構その「ひどいこと」になっちゃうOCRソフトが多い

777 :771:2008/09/25(木) 01:44:15 ID:VosBAVv30
レスありがとうございます。

>>773さんの書かれているところが問題のようですね。
試しに複合機で作成したPDFファイルをAcrobat Pro(の体験版)でTIFFに変換し、
それをOCRで自動処理し透明テキストPDF出力としたところ、
サイズの変動がほとんどなくなりました。
次からは複合機でのスキャン時にPDFではなくTIFFで保存することにします。

あとは見開きの傾き自動補正がどのソフトでもできないようなので、
これについてはTIFFファイルをどうにか処理してみようと思います。

マンガのスキャン技術スレはマニアックな深みにはまってるようですが、
検索用に本をPDF形式でため込むだけならかなりよい感じですね。

778 :名無しさん@お腹いっぱい。:2008/09/25(木) 08:14:14 ID:A9ZTqUPm0
>>777
>マンガのスキャン技術スレはマニアックな深みにはまってるようですが

そのスレ教えてください。

779 :名無しさん@お腹いっぱい。:2008/09/25(木) 14:59:37 ID:6Td5Al990
>あとは見開きの傾き自動補正がどのソフトでもできないようなので
読んでココはできるっしょ?

780 :名無しさん@お腹いっぱい。:2008/09/26(金) 13:37:29 ID:yFUJpsc5O
e.Typist使ってるんだけど、だんだん操作するのが面倒になってきたので、
ファイル名を渡して連続自動処理を開始させたいんだけど、
どうやれば可能なの?


781 :名無しさん@お腹いっぱい。:2008/09/26(金) 18:17:08 ID:z9c8uZzd0
>>778
【初めての】スキャン職人養成スレ 七【自炊】
ttp://changi.2ch.net/test/read.cgi/download/1217071704/
とか
【コミック】 自炊技術スレッド 30冊目 【書籍】
ttp://changi.2ch.net/test/read.cgi/download/1219749815/
とか見てると画質と作業時間のトレードオフで無闇に画質よりにしすぎてるような気がするのですが。

>>779
最初に読ませるファイルと最後の出力ファイル名以外は全自動でさせるモードだと、
普通の傾き補正しか選べなかったように思うのですが、もう一度見てみますね。
「見開きのラインを認識できないなら仕方ない」と漠然と考えていたのですが。

782 :名無しさん@お腹いっぱい。:2008/09/26(金) 18:39:15 ID:Dg2t2hyN0
>最初に読ませるファイルと最後の出力ファイル名以外は全自動でさせるモードだと、
ああ、OCRファクトリーのことか。
それは使ったこと無いからわかんないや。
読んでココで見開き自動補正というと、センターを手動で指定すると、
あとは自動で傾き検出、補正してくれるってことだから。

783 :名無しさん@お腹いっぱい。:2008/09/26(金) 20:07:07 ID:z9c8uZzd0
>>782
はい、そういう名前でしたね。
本をガンガン処理していきたいので手動センター指定を全ページというのがちょっと重荷なので。
もっとも、修正をかけなくてもOCR処理自体は問題なくしてくれるのでそれなりに満足です。

784 :名無しさん@お腹いっぱい。:2008/09/26(金) 20:13:45 ID:z9c8uZzd0
>>782
はい、そういう名前でしたね。
本をガンガン処理していきたいので手動センター指定を全ページというのがちょっと重荷なので。
もっとも、修正をかけなくてもOCR処理自体は問題なくしてくれるのでそれなりに満足です。

785 :名無しさん@お腹いっぱい。:2008/09/26(金) 20:31:24 ID:z9c8uZzd0
>>782
はい、そういう名前でしたね。
本をガンガン処理していきたいので手動センター指定を全ページというのがちょっと重荷なので。
もっとも、修正をかけなくてもOCR処理自体は問題なくしてくれるのでそれなりに満足です。

786 :名無しさん@お腹いっぱい。:2008/09/26(金) 20:32:42 ID:z9c8uZzd0
うわああ連投してしまってた。 申し訳ないですorz

787 :RQJgKKUofecPPwugoiK:2008/10/21(火) 00:23:09 ID:HUr/ledZ0
More about mesothelioma at <a href="http://www.webng.com/cancerlawyer/">mesothelioma cancer lawyer</a>
http://www.webng.com/cancerlawyer/
[URL=http://www.webng.com/cancerlawyer/]mesothelioma cancer lawyer[/URL]

788 :bBDymJSOLg:2008/10/21(火) 00:23:09 ID:TK425olO0
More about mesothelioma at <a href="http://www.webng.com/cancerlawyer/">mesothelioma cancer lawyer</a>
http://www.webng.com/cancerlawyer/
[URL=http://www.webng.com/cancerlawyer/]mesothelioma cancer lawyer[/URL]

789 :kIEszFhHEH:2008/10/21(火) 00:23:19 ID:E+wJqkJG0
More about mesothelioma at <a href="http://www.webng.com/cancerlawyer/">mesothelioma cancer lawyer</a>
http://www.webng.com/cancerlawyer/
[URL=http://www.webng.com/cancerlawyer/]mesothelioma cancer lawyer[/URL]

790 :lqhDyZkYU:2008/10/21(火) 00:23:25 ID:IPLca0TN0
More about mesothelioma at <a href="http://www.webng.com/cancerlawyer/">mesothelioma cancer lawyer</a>
http://www.webng.com/cancerlawyer/
[URL=http://www.webng.com/cancerlawyer/]mesothelioma cancer lawyer[/URL]

791 :rLrwTcsIAjZpfNgSA:2008/10/21(火) 00:24:59 ID:Ps1bh35Y0
NSr3Vk This pearl has a programmable grind and brew feature, it holds a quarter pound of coffee beans and it has a filter indicator to tell you when your water filter is pooched, http://frespmesh.cn/vonsweeklyad.html Vons Weekly Ad
, :[[, http://fresnmesh.cn/protran.html Protran
, 843, http://fresnmesh.cn/ludogameprogramminginc.html Ludo Game Programming In C
, jii, http://fresimesh.cn/snugharbormarinachautauquany.html Snug Harbor Marina Chautauqua Ny
, enlfg, http://fresimesh.cn/jardinetechnicalservices.html Jardine Technical Services
, 8], http://freshmesfsdfh.cn/lightbearers.html Lightbearers
, fvfm, http://fresimesh.cn/safestprescriptioneyeglassesfdaapproved.html Safest Prescription Eyeglasses Fda Approved
, 966151, http://fresjmesh.cn/femalepudenda.html Female Pudenda
, 8-(, http://fresqmesh.cn/sacagaweadollarquartermachined.html Sacagawea Dollar Quarter Machined
, 6948, http://fresmmesh.cn/hydrolux.html Hydrolux
, :PPP, http://freskmesh.cn/dvop.html Dvop
, 8-PPP,

792 :名無しさん@お腹いっぱい。:2008/10/28(火) 07:01:10 ID:2UwgvcQp0
読んでココ、早くunicode文字に対応してくれ!

793 :名無しさん@お腹いっぱい。:2008/10/29(水) 19:21:47 ID:GUt1EgdT0
OCRソフトって、前後の文字から推測するアルゴリズムにすれば
熟語とかの認識率が格段に上がるはずなのになんでやらないんだろう?
どうみても1文字ずつ単体でしか認識しようとしてないよな。

794 :名無しさん@お腹いっぱい。:2008/10/29(水) 20:30:23 ID:K8CjuoRX0
OCRって、元々の用途を考えると文章には不向きなんだよね。
申し込み用紙など決まった書式の中に住所、氏名書くようなものとか葉書(送り先を読み取って自動仕分けする機械がある)とか。
一語一句(誤字脱字も異字体も)正確に読み取るような用途向けだったはず。

それに、1文字でも誤認識があると、熟語全体を誤認識する可能性すらある。(だから「格段に上がるはず」という想定が通用しない。)
それを自動でどうにかするのが逆に難しい。1文字の区切りや行、列の方向を誤認識する事すらあるくらいなのに、複数文字組み合わせで
判定しようとすると辞書に無い熟語は認識率が上がらないし、辞書に無い熟語を「辞書にある熟語」で誤認識する可能性もある。
辞書の語彙を増やすと似たような文字を誤認識した場合に熟語ごと誤認識する可能性も高まる。

結局は1文字ずつちゃんと認識できないと辞書があっても誤認識率が上がるか大して変わらないからあまり意味が無いのでは?と思う。(人間の曖昧情報の認識力って優秀だよね、と思える部分)
かな漢変換エンジン(今で言うIME)のメーカーとOCRメーカーが組んで作ったところで・・・1文字誤認識しただけで1文丸々誤認識とか勘弁して欲しい事態になることも。

795 :名無しさん@お腹いっぱい。:2008/10/30(木) 11:25:27 ID:6UKMxSSc0
そこまでいく文字認識じゃなくて人工知能だからね。
コンピュータに一般常識やら駆け引きやらを実行させなくてはならない問題だ。
膨大なデータベースと高速演算が出来れば可能なのかもしれないが。

796 :793:2008/10/30(木) 18:26:59 ID:wNT2JRDf0
いやいや人工知能ってほど大げさなものじゃなくてさ。
例えば「微細」っていう言葉を認識するのに、ソフトは1語ずつ第一候補・第二候補…と
候補の語をいくつか持っていると思うんだよ。
それで2つの語の候補がそれぞれ、[1:徴 2:微 3:徹] [1:細 2:紳 3:組]だったとすると
この語句の組み合わせ(3x3=9通り)で熟語として成り立つのは「微細」だけ。
1語ずつ認識すると「徴細」という誤った結果になるけど、語の組み合わせで辞書と照合
すれば正しく「微細」となる。
単純に、辞書で照合できた熟語だけ優先的に出力するということ。
活字のOCRならこの方法が有効だと思うんだけどなあ。

797 :名無しさん@お腹いっぱい。:2008/10/30(木) 18:37:13 ID:1mZmHH950
>>793
実際高い製品ではそういうのができるものもあるよ。
というかスペルチェッカや文法チェッカのような技術は確立してるし、日本語の形態素解析も、再変換の技術がある程度確立してるから、技術的な困難はない。
ただデータベースのサイズが格段に上がるうえ、認識に極端な時間がかかる、辞書に載ってない言い回しや単語に弱い、言語が固定されてしまう(外来語に弱い)等の問題がある。


798 :名無しさん@お腹いっぱい。:2008/10/30(木) 20:28:12 ID:/oREtNdF0
そういう機能って、E.
とか読とかにだって最初からついてるよ。
マニュアルちゃんと読んで使えるようになってください。

799 :名無しさん@お腹いっぱい。:2008/10/30(木) 21:45:34 ID:MMyq2Afv0
英語のような分かち書きする言語だと比較的対応してるよな

800 :793:2008/10/31(金) 18:17:48 ID:JCWTUkt60
>>798が言ってるのはおそらくよく間違えて認識する単語を予め手動で登録しておく
ユーザー辞書のことを言ってるんだと思う。
俺が言ってるのはそうじゃなくて、国語辞典並みの20万語くらいの辞書をソフトが
持っていてその辞書を使って認識させることを言ってる。確かに>>797が言うように
極端に時間がかかる可能性があるし、メモリも食うと思う。今まで1時間程度で
終わってた処理がもしかしたら10時間くらいかかるかもしれない。でもそれだけ
かかっても認識の精度の方を選びたいという需要はあると思うんだよな。速度重視と
認識率重視の2つのモードがあってもいい。現在95〜99%と言われる認識率が1〜2%
上がるだけでも十分価値がある。最近のマルチコアのCPUを有効に活用できると思うし。

801 :名無しさん@お腹いっぱい。:2008/10/31(金) 20:11:39 ID:bCRz+lPk0
時間のかかるOCRソフトに用はありません
昔の3D処理ソフトじゃあるまいし


802 :名無しさん@お腹いっぱい。:2008/10/31(金) 20:29:59 ID:xBhEoWYg0
>>800
長文書く前にOCRを使ってみてはどうか?
お望みの辞書がついてると思う。
が、お望みの価値は見出せないだろう。

803 :名無しさん@お腹いっぱい。:2008/10/31(金) 21:12:56 ID:JLOd34LC0
>>800
先ずワードのスペルチェッカや文法チェッカを使えよ
道具を使えないんじゃチンパンジー以下だぞ

804 :名無しさん@お腹いっぱい。:2008/11/01(土) 03:50:42 ID:SFh3NAV80
>>800

ttp://mediadrive.jp/products/wrp/index.html
ttp://mediadrive.jp/products/wrp/index5.html


805 :名無しさん@お腹いっぱい。:2008/11/01(土) 13:09:12 ID:A6vJWRwI0
e.typistのバージョン上がってたから一応
001408DE : 11→00

eTyp12mem.dllは一緒

806 :名無しさん@お腹いっぱい。:2008/11/02(日) 13:02:46 ID:AJubgEGf0
たぶんOCR使ったこと無くて、想像で言ってるんだろうね。
現状、認識処理に1時間もかかるわけがないw


807 :名無しさん@お腹いっぱい。:2008/11/02(日) 16:11:17 ID:SxT+me9H0
OCRだって自然言語処理してるよ
認識候補に対して辞書を使って絞り込みとかやってる

808 :名無しさん@お腹いっぱい。:2008/11/02(日) 16:15:31 ID:9MBAetAc0
認識処理は昔から早いけど、
結局は結果確認と誤認識や体裁の修正は必ずしないといけない。
その修正作業がどれだけ楽になるかがOCRソフトの一番大事なところ。

809 :名無しさん@お腹いっぱい。:2008/11/02(日) 17:28:07 ID:cwzkfA700
>>805
kwsk

810 :名無しさん@お腹いっぱい。:2008/11/02(日) 17:31:04 ID:poJP7dLr0
>>809
いや駄目だろ、それは

811 :名無しさん@お腹いっぱい。:2008/11/08(土) 08:38:05 ID:ZMhDwSXi0
素人ですみません。
OCRソフトを探しています。
透明テキストの機能を使って、文書の全文検索に使えるようにしたいと考えています。
PDFに変換してから、ちょこちょこといじりたいのですが、acrobatのOCR機能ってどうなんでしょうか?
OCR機能の点からみたacroatのメリット・デメリットは、>>763以外になにかありますか?(認識率が格段に低いなど)
SmartOCRは現在のOCRのシェアウェアやacrobatよりもどんな点で劣る(あるいは優れている)か教えてください。

812 :名無しさん@お腹いっぱい。:2008/11/09(日) 12:45:08 ID:EZAsVtJx0
PDFのOCR機能は画像OCRの付け焼き


813 :名無しさん@お腹いっぱい。:2008/11/12(水) 02:08:52 ID:6OQUopCS0
>>805
差分ファイルで

814 :名無しさん@お腹いっぱい。:2008/11/16(日) 04:24:48 ID:4vajSCcA0
読んde!!ココの次期バージョンは当分ないのだろうか?
ブラザーA3複合機買ったんだけど、OCRソフトは何買ったらいいか迷う。
Acrobat8持ってるから充分なのか、読んde!!ココ 13にアップグレードするか。
それともe.Typistを使ってみるか。
最終出力はテキスト付きPDFにしたいんだけど。
イチオシのワークフローあるかな?

815 :名無しさん@お腹いっぱい。:2008/11/16(日) 05:27:56 ID:0tZlWar00


816 :名無しさん@お腹いっぱい。:2008/11/16(日) 06:36:32 ID:0tZlWar00


817 :名無しさん@お腹いっぱい。:2008/11/16(日) 15:06:04 ID:kMc8Bxa00
読取革命12体験版を使ってみたんだが・・・・。
表編集モードにおいて、誤認識された罫線の削除のコツがよくわからない。
はさみのアイコンでなぞっても、消えない事が圧倒的に多い。
まるで出来ないかというとそうでもなく、あーでもないこーでもないとやっているといきなり消えることもある。
エロイ人、どうかこつを教えてくれ。

818 :名無しさん@お腹いっぱい。:2008/11/23(日) 14:26:28 ID:vpMal3Xl0
「本格読取 2」と「本格読取 2 Deluxe」って
何が違うんですか?


819 :名無しさん@お腹いっぱい。:2008/12/01(月) 15:15:27 ID:LWVSjDCk0
これまで何の疑問もなく「読んde!!ココ」 のバージョン10.01を使ってきた。
バージョン上げると読み取り精度は上がるのだろうか?
俺が使うのは英文ばかりだけどfの読み取りが悪くてイライラ。

820 :名無しさん@お腹いっぱい。:2008/12/02(火) 11:26:40 ID:j5O/upWL0
英文ならomnipageとか使え

821 :名無しさん@お腹いっぱい。:2008/12/02(火) 14:14:45 ID:u3ql/6+p0
FineReaderの最新版は抜群の精度

822 :名無しさん@お腹いっぱい。:2008/12/03(水) 01:16:37 ID:tni9wAEC0
>>817
ハサミの左の先端で消したい罫線をなぞると良いよ。

ってもう試用期間終わってるかな?

823 :名無しさん@お腹いっぱい。:2008/12/03(水) 14:02:21 ID:7DjjIJfp0
>>818
回答こないね


824 :jrOORvtvExkE:2008/12/04(木) 06:23:20 ID:eYjGu4xE0
Useful info about <a href="http://mesothelioma-disease.blog.ca/">mesothelioma cancer</a>
http://mesothelioma-disease.blog.ca/
[URL=http://mesothelioma-disease.blog.ca/]mesothelioma cancer[/URL]

825 :BPCEZIWpAquwwspfZk:2008/12/04(木) 06:23:22 ID:VbG12Y6T0
Useful info about <a href="http://mesothelioma-disease.blog.ca/">mesothelioma cancer</a>
http://mesothelioma-disease.blog.ca/
[URL=http://mesothelioma-disease.blog.ca/]mesothelioma cancer[/URL]

826 :名無しさん@お腹いっぱい。:2008/12/15(月) 08:02:30 ID:3Dr8GKKG0
読んでココv13の質問なんですが、
認識結果を修正するとき、候補文字から選択するとどんどんユーザー辞書に追加されていきます。
初期状態は、追加するかどうか、確認画面が出てたのですが、確認しないをチェックしてしまいました。
これを元に戻したい(確認画面が出て、不必要な辞書登録をしない)のですが、どこにその設定があるのか分かりません。
かなり探したのですが・・・何処に隠れてるのでしょう?ご存知の方教えてください。

827 :名無しさん@お腹いっぱい。:2008/12/15(月) 23:31:57 ID:SxBJUL7R0
自己解決しました。

別の問題が出てきました。
同じく、認識結果を修正中に、
候補文字から選択すると、半角指定してるはずの記号が全て全角になってしまいます。
仕事場と自宅で別々の読んでココを使ってるのですが、
仕事場のほうは半角で出てくるのですが、自宅は全角です。
環境設定とか同じはずなんだけどなあ・・・
ユーザー辞書が違うからかな?

828 :名無しさん@お腹いっぱい。:2008/12/16(火) 12:37:06 ID:62OVPLgO0
ユーザー辞書を移植したら、同じように半角で出てくるようになった・・・・
・・・・が、
今度は、移植した辞書に新しい字を追加しようとしたらエラーが出て落ちてしまう・・・orz
なんなんだ?
デフォだとユーザー辞書は隠しファイルになってるし、ダミーが置いてあったりするし、
移植したファイルは読めても書けない仕様なのか?
隠しファイル領域に入れないと駄目なのかね?
ヘルプ読むと、場所は何処に置いても良さそうなこと書いてるが。
俺みたいに2台のPCで場所変えて作業してる人のために、
設定や辞書の共有が出来るような仕組み無いのかね?

829 :名無しさん@お腹いっぱい。:2008/12/16(火) 16:09:26 ID:MKgRiCmn0
お前はマニュアルを読んでここ

830 :名無しさん@お腹いっぱい。:2008/12/16(火) 17:02:09 ID:/jtierzP0
ヘルプのマニュアルは一応読んでるよ。
でも読み落としてるかもしれないから、何処に載ってるか教えてくれよ。
ただの煽りなら引っ込んでろ。

831 :名無しさん@お腹いっぱい。:2008/12/16(火) 18:33:15 ID:ir5gL59l0
>>830
おまえ人に聞く態度か、ドアホ〜
おまえ頭悪いんじゃ 自覚せい 消えろ〜
買ったところから聞け たわけ〜

832 :名無しさん@お腹いっぱい。:2008/12/16(火) 19:21:17 ID:+a6zF2z/0
    ∩___∩           |
    | ノ\   ,_ ヽ      |
   /  ●゛  ● |         |
   | ∪  ( _●_) ミ      (>>830) 
  彡、   |∪|   |       J
 /     ∩ノ ⊃  ヽ
 (  \ / _ノ |  |
  \  "  /  | |
   \ / ̄ ̄ ̄ /

833 :名無しさん@お腹いっぱい。:2008/12/16(火) 20:59:44 ID:1zLemMeh0
やれやれ・・・釣り扱いかよ。
自己解決しますた。
ユーザー辞書の移植は、読み取りだけならdicファイルだけでいいけど、
書き込むにはコントロールファイルもいるんだな。
マニュアルには載ってないようだけど、

834 :名無しさん@お腹いっぱい。:2009/01/10(土) 08:16:09 ID:eYWtFstc0
あぁ、1TBHDDが安くなりすぎてテキスト化しなくてもいいと思い始めた。

835 :名無しさん@お腹いっぱい。:2009/01/10(土) 13:00:54 ID:TYnOKpqB0
↑いやいや、検索するって役割があるでしょ。

質問です。
e.Typistをインストールすると、mediadriveというフォルダが、Documentsフォルダに作られますが、移動するにはどうすればよいですか。
これ非常に不便なのですが・・・

836 :名無しさん@お腹いっぱい。:2009/01/10(土) 15:12:22 ID:IPOI/TmT0
透明PDFにpngが使えないので萎えた
lzwのtiffでも数倍でかくなる


837 :名無しさん@お腹いっぱい。:2009/01/10(土) 16:30:03 ID:LjtLb05Y0
OCRソフトってPDFの扱いが弱すぎるよね

838 :名無しさん@お腹いっぱい。:2009/01/11(日) 00:40:51 ID:iuR1Bu1I0
そもそもPDFっていらないしな。

839 :名無しさん@お腹いっぱい。:2009/01/11(日) 02:42:06 ID:sd43c4tCP
いやいやいや、今んところ透明テキストつきPDF以上に、
バランスの取れた形式ってないんじゃないのか?

OCR変換したテキストデータのみを使うとか正気の沙汰じゃないけど、
文字列検索ができるのはただの画像データにはないメリットだし、
何よりも可搬性が高いというメリットもあり。

>>838はこのスレでPDFいらないっていうことは
全部テキストデータで保存してるのか?

840 :名無しさん@お腹いっぱい。:2009/01/11(日) 02:46:38 ID:iuR1Bu1I0
検索しないから。一度読んだらだいたいの場所は頭に入ってる。
読むの速いし、パラパラ高速でめくれないPDFは論外。

841 :名無しさん@お腹いっぱい。:2009/01/11(日) 02:59:40 ID:sd43c4tCP
まぁ、検索するかどうかは確かに使い方次第かもしれないな。
でもPDFがパラパラ高速でめくれない、ってそれは単純に
PCのスペックによるものなんじゃね?

300ページくらいの本をスキャンして30MBくらいで保存してるけど、
Adobe Readerで見開き2ページ表示にしてもさくさくPageUp/Downできるけどなぁ。

842 :名無しさん@お腹いっぱい。:2009/01/11(日) 03:12:05 ID:iuR1Bu1I0
読むの遅いんじゃね?

843 :名無しさん@お腹いっぱい。:2009/01/11(日) 03:16:50 ID:sd43c4tCP
いやいやwww
PageDown押しっぱなしで300ページ見開き表示(150面)
の冒頭から最後まで15秒もかからないんだけど、
どんな速読マスターでもさすがにこのスピードは無理じゃないのか?

ということで脱線してきたのでもうレスはつけない。
スレ汚しすまない。

844 :名無しさん@お腹いっぱい。:2009/01/11(日) 04:09:13 ID:/tuIuVbi0
検索を使わなくてすむような使いかたしかしてない時点で

845 :名無しさん@お腹いっぱい。:2009/01/11(日) 10:08:10 ID:osstJUh50
小説とか?にしか使ってないのかな?
学術書や研究書をデータ化して検索可能にすると全然
違ってくるんだよね

読むときに単語ひとつひとつにまで注意は払えないけど
後から違うテキストにある単語の用法を検索するとか
単語が使われる頻度を調べるとかさ

846 :名無しさん@お腹いっぱい。:2009/01/11(日) 16:45:17 ID:iuR1Bu1I0
頭に入ってない、知らないかから検索しなきゃいけないんだろ。要はただの馬鹿。
統計とるのにOCRで作った修正処理してない、合ってるか間違ってるか
分からない透明テキストPDF使うなんて研究者失格だな。
専門分野なら頭に簡単に入るだろ。stockの知識は暗記しろ。

847 :名無しさん@お腹いっぱい。:2009/01/11(日) 19:07:28 ID:N53izUZ70
>>846
よう、天才。
あんた、なんでこのスレに粘着してんだ?

848 :名無しさん@お腹いっぱい。:2009/01/11(日) 19:18:36 ID:/tuIuVbi0
まじ天才。




俺の大学では会議はまだプリントされた紙を配る。
邪魔だから、PDFで保存。紙は捨てる。
学内自転車置き場に置かれた放置自転車の問題とか
入学試験の試験監督とか



これ結構な量なんだよ。
まれにこれが必要になるから困る。


でこんなものも全部頭に入れてるの?
俺なんて会議中熟睡だぜ



ありえんな。研究者とか書いてるが
ただのニートと見た。




849 :名無しさん@お腹いっぱい。:2009/01/11(日) 22:52:25 ID:xF2BYn5G0
インド人じゃないの?
向こうのエリ−トは2時間くらいの会議ならその会議での会話を そらで再現出来る頭だって。

850 :名無しさん@お腹いっぱい。:2009/01/12(月) 01:47:20 ID:n3qvCL0O0
SVGがもうすこしがんばってくれれば、、、

851 :名無しさん@お腹いっぱい。:2009/01/12(月) 02:07:33 ID:SDQi6vqPO
おまえらレベル低いな。俺の国では読む前から本の内容くらい完璧に再現できないようなら落ちこぼれだから。

852 :名無しさん@お腹いっぱい。:2009/01/12(月) 10:44:58 ID:iaaaILbh0
テキスト化スレでなんでPDFを称賛してんだ?
スレ違いだ。

853 :名無しさん@お腹いっぱい。:2009/01/12(月) 10:52:21 ID:Z3wpMu5b0
>>852
ID:iuR1Bu1I0は、テキスト化すら必要なさそうだが。

854 :名無しさん@お腹いっぱい。:2009/01/12(月) 10:53:10 ID:n3qvCL0O0
つ透明テキスト付きPDF


855 :名無しさん@お腹いっぱい。:2009/01/12(月) 10:56:31 ID:iaaaILbh0
誘導 >> PDFの素晴らしさ話題はこちらへ

PDF作成・変換ソフト。Part 5
http://pc11.2ch.net/test/read.cgi/software/1200771165/

856 :名無しさん@お腹いっぱい。:2009/01/12(月) 12:38:29 ID:ZsusePTR0
透明テキスト付きPDFさえスレ違い認定してる奴って
なんなんだろう?

手元に元資料なくなったら読取り間違いを見つけるのに
PDFの画像だけが頼りじゃん

完全にテキストデータしか残さないの?

857 :名無しさん@お腹いっぱい。:2009/01/12(月) 13:24:35 ID:hw4QZewC0
>>849
そんなわけないだろw

12年と235日前の会議でもすべて覚えてるんかいw

858 :名無しさん@お腹いっぱい。:2009/01/12(月) 13:26:19 ID:AdJ5kc2+0
>>849
インド人の友達いるけど、みんな馬鹿だよ

859 :名無しさん@お腹いっぱい。:2009/01/12(月) 16:56:21 ID:KqRtE+b10
>857が馬鹿なだけだと思うよ。
子供の反論だな。
「何時何分何秒に〜」w
まさか成人じゃないよね?

860 :名無しさん@お腹いっぱい。:2009/01/13(火) 01:49:48 ID:Ck0kGCM30
何時何分ってアホ?

検索する必要もない奴がテキスト化してパソコンに保存?
もっとアホだな
テキスト化してパソコンに保存する時間が無駄だろうがw
その間にどれだけの文章を頭の中に入れれるの?天才君

861 :名無しさん@お腹いっぱい。:2009/01/13(火) 11:24:35 ID:EXPdIEAt0
WinReaderPro買うかどうか迷っている。
お前らどう思う?
用途は10万枚のxdwファイルの検索目的。

862 :名無しさん@お腹いっぱい。:2009/01/13(火) 15:36:04 ID:uERZu1aC0
xdwってそのまままじゃ検索できないんだ
へー

863 :KYjGIJJNILUJsLT:2009/01/13(火) 15:38:01 ID:ZVGLIrsS0
http://naierrybou.awardspace.com/tna-victory-road-stream.html tna victory road stream
http://ontoned.awardspace.com/rumer-willis-photo.html rumer willis photo


864 :名無しさん@お腹いっぱい。:2009/01/14(水) 01:19:58 ID:L5omtrlo0
こんなスレに天才君がごろごろしてるとは・・・・・



865 :名無しさん@お腹いっぱい。:2009/01/14(水) 02:10:19 ID:0z5ueTXF0
>>862
scanした原稿とかは無理だよ。

866 :名無しさん@お腹いっぱい。:2009/01/15(木) 03:47:41 ID:ooQikYrc0
透明テキスト付きPDFの話なんてどうでもいいんだけど。
透明テキスト付きPDFで、テキストに変換した内容をチェックする馬鹿はいないんだから。
ここでは議論が成り立たない。

867 :名無しさん@お腹いっぱい。:2009/01/15(木) 08:28:25 ID:pt+iPJxK0
>>866
出たな、天才。

868 :名無しさん@お腹いっぱい。:2009/01/15(木) 11:27:58 ID:U2eiW9BI0
学術論文データベースでダウンロードできるファイルは
ほとんどが透明テキスト付きPDFでございますw

869 :名無しさん@お腹いっぱい。:2009/01/15(木) 12:58:17 ID:Coc/BK/S0
>>868
医学論文はスキャンされたPDFが郵送とFAXとかダウンロードできるだけというのが全てかも。
俺が入会している論文屋はそうだね。日本では業界最大手だと思うけど。
それに本をばらしてscanしまくっているから透明テキストは自分でつけないといけない。

870 :名無しさん@お腹いっぱい。:2009/01/15(木) 13:31:32 ID:/jTW0YpK0


871 :名無しさん@お腹いっぱい。:2009/01/15(木) 18:17:23 ID:ooQikYrc0
>>868
だからスレ違いじゃん。
論文作った人がPDFにしてテキストつけてるのに画像→テキスト化のこのスレに何の関係あるんだよ?

872 :名無しさん@お腹いっぱい。:2009/01/15(木) 18:38:34 ID:TDkR8k5P0
たしかに(DAIGO)
論文書いたならワードとかだろうからそこからpdfに変換したら
文字化けもなにもないな
最初から文字としてpdfに埋め込まれてるだろう

873 :名無しさん@お腹いっぱい。:2009/01/15(木) 21:52:56 ID:0k7MXLGD0
論文データベースで提供される最近の論文なら学術誌の
ページまんまの普通にフォント込みのPDF
昔のものはスキャンされて透明テキスト付きPDF

同じように自分でスキャンした論文や本も透明テキスト付きで
残しておいて管理したいってわけ

しつこく透明テキスト付きPDFを排除しようとしてる人は
こういう用途を理解できないのかな?自分に関わりのない
用途だからって排除するってのはどうかと思うよ

874 :名無しさん@お腹いっぱい。:2009/01/15(木) 23:51:54 ID:pTl37oBI0
2名くらいが言い合ってるんだろうが
そろそろメールででもやれw

875 :名無しさん@お腹いっぱい。:2009/01/16(金) 02:04:18 ID:o0QiI79a0
読んでここと読み取り革命とe.typist
全部使ってみたけど
読んでここが一番まともだった

876 :名無しさん@お腹いっぱい。:2009/01/16(金) 04:31:05 ID:j5jbP+DhP
一番妙な名前のが一番まともっぽいんだよな。
でもどこも煮詰ってきちゃって停滞してる感じもする。

877 :名無しさん@お腹いっぱい。:2009/01/16(金) 07:10:00 ID:kAwCRT9v0
>>873
うざいからPDFスレでやれ。

878 :名無しさん@お腹いっぱい。:2009/01/16(金) 07:13:05 ID:YFgvyqNy0
よんでここ良いかあ?
typistだろ

879 :名無しさん@お腹いっぱい。:2009/01/16(金) 08:54:17 ID:KNjWFBiV0
>>878
中の人、乙

880 :名無しさん@お腹いっぱい。:2009/01/16(金) 12:34:31 ID:ar3mUcAl0
で、WinReaderProを使った奴はいるか?おれはxdwでscanした文章が20Gくらいあるんだよ。
DocuWorks内蔵のOCRも悪くないけど、更に精度が上がるなら20万出してもいいかなと思うのだが。
俺が人柱になるしかないのか?

881 :名無しさん@お腹いっぱい。:2009/01/16(金) 19:19:39 ID:u6xluZvZ0
そうだね

882 :名無しさん@お腹いっぱい。:2009/01/17(土) 12:03:50 ID:q4cOoTS30
構って君登場w


883 :名無しさん@お腹いっぱい。:2009/01/17(土) 13:22:33 ID:8LomD8UX0
くそ。
お前らがそういう態度なら絶対に書いてやらない。
WinReaderProで得た経験を誰にも教えないぞ。

884 :名無しさん@お腹いっぱい。:2009/01/17(土) 13:36:24 ID:ajPyCMtQ0
精度なんて似たり寄ったり。重要なのは確認、修正作業のし易さ。

885 :名無しさん@お腹いっぱい。:2009/01/17(土) 13:44:11 ID:8LomD8UX0
まじかよ。そんなことしていられないよ。
検索で引っ掛けるのが目的だし。
20万円の価値は無いのか。

886 :名無しさん@お腹いっぱい。:2009/01/17(土) 17:14:11 ID:3jWVocFV0
買えば済むのに

887 :名無しさん@お腹いっぱい。:2009/01/17(土) 21:05:47 ID:q4cOoTS30
https://ssl.mediadrive.jp/cgi-bin/demand/form.cgi?id=wrp12
ほんとに買う気なら体験版をとりあえず申し込むべし。

888 :名無しさん@お腹いっぱい。:2009/01/20(火) 16:59:05 ID:Ez5R3CRM0
読取革命大好き

889 :名無しさん@お腹いっぱい。:2009/01/21(水) 02:20:01 ID:nux6CWbW0
>>887
申し込みます。DocuWorksのVer6とVer7と比較してよければ買います。
全文検索は行方不明書類を捜す唯一の手段だからな。
行方不明書類ってどうしても発生するんだよね。
Scan時の重送で検出漏れもあるしね。

890 :VdTyVIXmByCFJdJ:2009/01/21(水) 02:28:08 ID:27CcxXma0
3ofhNQ <a href="http://jicyqypxfieh.com/">jicyqypxfieh</a>, [url=http://tdeqcqoimwwk.com/]tdeqcqoimwwk[/url], [link=http://qykftmbejfxg.com/]qykftmbejfxg[/link], http://nriidvmyuevw.com/

891 :名無しさん@お腹いっぱい。:2009/01/21(水) 17:02:44 ID:1Yv8qxGD0
>>873
>同じように自分でスキャンした論文や本も透明テキスト付きで
>残しておいて管理したいってわけ

同じく。最新のAcrobatでも表があるページだと表部分だけでなく本文部分
の透明テキスト化も玉砕するんで困ってます。表が入っててもそこそこの
OCR化をしてくれて透明テキストとして出力してくれるソフトってあるの
でしょうか?




892 :名無しさん@お腹いっぱい。:2009/01/21(水) 21:37:36 ID:NwoVvKSk0
E.TYPISTでいいんじゃないの?

893 :名無しさん@お腹いっぱい。:2009/01/21(水) 21:40:41 ID:ze4pJbzr0
企業内でスキャンしたい対象ってどんなのがあるかな?

894 :名無しさん@お腹いっぱい。:2009/01/21(水) 21:47:38 ID:nux6CWbW0
>>893
FAXやら報告書、見積書、請求書、領収書。

895 :名無しさん@お腹いっぱい。:2009/01/21(水) 21:50:24 ID:ze4pJbzr0
わかるわ

896 :名無しさん@お腹いっぱい。:2009/01/21(水) 23:36:46 ID:VPMtNf1U0
>>891
つ ScanPaper for PDF
絶賛絶版中
残念。....Ver. up待ってたのに...orz

897 :名無しさん@お腹いっぱい。:2009/01/22(木) 14:57:17 ID:hloqxcjl0
>>891
スレ違い。

898 :YLwdkzJwQk:2009/01/22(木) 14:59:20 ID:XZya3rFK0
comment3, http://cxlkueu.tripod.com/sun-vall96/104.html us immigration and naturalization servic, 41903,

899 :名無しさん@お腹いっぱい。:2009/01/26(月) 14:02:08 ID:B6gIH/Ys0
>>897
そっか?ここ「画像→テキスト化総合」スレだぞ。


900 :名無しさん@お腹いっぱい。:2009/01/27(火) 01:41:17 ID:upxCQJ3+0
WinReaderProの試用版ダウソしたぞ。
結構いいな。でも、DocuWorks文章だとファイル1枚ごとの取り込みだから気が遠くなるくらい遅い。、東南アジアとか中南米で仕事をするくらいのスローペース。
全く実用にならない。


901 :名無しさん@お腹いっぱい。:2009/01/27(火) 07:41:36 ID:htkl5rYY0
精度がいいんだったらそれくらいの時間我慢しろ

902 :名無しさん@お腹いっぱい。:2009/01/27(火) 11:33:20 ID:upxCQJ3+0
>>901
一枚一枚手作業できるかよw

903 :名無しさん@お腹いっぱい。:2009/01/28(水) 00:27:11 ID:7RPnoVYN0
結局、Docuworksからエンジンを呼び出して使う方法しかないね。でも、デモ版ではこの機能が使えない。。。
300dpiで取り込んだ書類の8pointの文字をきちんと認識したのはさすがだった。
DocuworksはVer6でもVer7でも誤認識したのに。
買うかな。。。でも、実売15万か。。。

904 :名無しさん@お腹いっぱい。:2009/01/29(木) 00:40:07 ID:FGLDXW2v0
俺も興味あるけけど手が出ない。
少なくとも今年度はe.typistで我慢する。

905 :名無しさん@お腹いっぱい。:2009/01/29(木) 00:43:31 ID:DOKx3o1yi
じゅうごまんて…

906 :名無しさん@お腹いっぱい。:2009/01/29(木) 00:51:16 ID:ropRgQQh0
おまえら解像度って何DPIでやってる?
おれは300くらいが多い

907 :名無しさん@お腹いっぱい。:2009/01/29(木) 07:37:06 ID:xvpcz/Pm0
やたらにあげればいいってもんでもないからなー

908 :名無しさん@お腹いっぱい。:2009/01/29(木) 12:49:52 ID:T1yzQr3p0
300dpiが標準みたいなもんじゃないの?
ソースによっちゃ2値で600dpiとか

909 :名無しさん@お腹いっぱい。:2009/01/29(木) 17:54:21 ID:Ed9NlCzi0
400dpi一択だろ

910 :名無しさん@お腹いっぱい。:2009/01/29(木) 22:46:35 ID:D6+z1xdv0
DR-9080cなんだけど、白黒2値でも300→400dpiにすると爆遅になるから300dpiでやってる。

911 :名無しさん@お腹いっぱい。:2009/02/03(火) 03:23:38 ID:HxZG/uXi0
WinReaderProはやっぱりすごい。
試用版使うと欲しくなるね。

912 :名無しさん@お腹いっぱい。:2009/02/04(水) 00:19:47 ID:x8k+Og7u0
精度倍にするとサイズが4倍になるからなぁ。どこで妥協するかだな。

913 :名無しさん@お腹いっぱい。:2009/02/04(水) 00:34:40 ID:LtK96ZYb0
業務用OCR使ってる人いる?
個人向けだと激遅でしゃれにならん

914 :名無しさん@お腹いっぱい。:2009/02/04(水) 02:23:14 ID:Sf1tdOm70
>>913
WinReaderProの試用版を使用中だけど、いいよ。
xdwファイル200枚読み込ませて、レイアウト認識と文字認識をさせたけど早かったよ。
何よりも300dpiなのに認識制度が良いのがすごい。おいらは買うつもりだよ。

915 :名無しさん@お腹いっぱい。:2009/02/06(金) 21:55:20 ID:JBi895MP0
「読んDE!!ここ10」使ってるんだけどDocuWorks7とどっちが読み取り精度が高いかな?
しかしヨンデにしろドキュにしろネーミングがもう少しどうにかならないのかな

916 :名無しさん@お腹いっぱい。:2009/02/06(金) 22:02:22 ID:xcbJkV810
読んでここと読み取り革命とe.typist使ったけど
読んでここが一番良かった

917 :名無しさん@お腹いっぱい。:2009/02/07(土) 08:16:45 ID:twOvbx690
それは無いわ

918 :名無しさん@お腹いっぱい。:2009/02/07(土) 08:50:20 ID:6OxclPlX0
精度なんて誤差程度だ。どうせ修正するんだし操作性で選んだほうが
画像→テキストまでのトータルの時間は短くなるよ。

919 :名無しさん@お腹いっぱい。:2009/02/07(土) 09:31:55 ID:twOvbx690
それはあるな

920 :名無しさん@お腹いっぱい。:2009/02/07(土) 15:55:55 ID:FYPR5kDC0
修正も数値とかが微妙に読み違われてるとなかなか気がつかないし影響も大きかったりするんだよね。
ワードの校正で候補がでるような読み違いならいいんだけど。

921 :名無しさん@お腹いっぱい。:2009/02/07(土) 19:48:47 ID:w8++l3bX0
読取革命13出たけど、認識精度には言及していないな
マイナーチェンジってとこかな

922 :名無しさん@お腹いっぱい。:2009/02/08(日) 01:48:34 ID:1Shh/Cmw0
工数かけて認識率コンマ数%上げるのはROIが悪いんだろうな

923 :名無しさん@お腹いっぱい。:2009/02/08(日) 02:39:28 ID:TUnhFzOr0
バカが校正したらアホな結果しか得られない。
この壁はいくらOCRソフトが優秀だろうと超えられない。

924 :名無しさん@お腹いっぱい。:2009/02/09(月) 20:25:13 ID:0NQO+I390
AWSには日本語OCRサービスなんてまだ無いよね。
アメリカだと2万円で1100万枚の画像(4TB)を1日でPDF化できるそうだけど。
http://www.atmarkit.co.jp/news/200805/29/cloud.html

925 :名無しさん@お腹いっぱい。:2009/02/10(火) 13:06:35 ID:l9n3EX/G0
Docuworks内蔵のOCRで生年月日の日が目になっていて、顧客の生年月日が取り出せなくて困った。
WinReaderProではちゃんと日と認識した。小さいことだけど、こういうことの積み重ねが業務を円滑にするね。

926 :名無しさん@お腹いっぱい。:2009/02/11(水) 00:40:07 ID:hZdgqhzk0
WinReaderProと読んでここはどっちが認識精度いい?

927 :名無しさん@お腹いっぱい。:2009/02/11(水) 01:25:55 ID:jOfQULL60
読んでここの方が圧倒的に優れている。

928 :名無しさん@お腹いっぱい。:2009/02/11(水) 01:27:49 ID:hZdgqhzk0
WinReaderProはサーバー用ソフトだから値段高いだけなんだよな
高いからって精度いいわけじゃないよね

929 :名無しさん@お腹いっぱい。:2009/02/11(水) 01:32:12 ID:jOfQULL60
>>928
まじレスすると、Docuworks内蔵のOCRより精度がいいね。
俺はDocuworksと連携するつもりだから、ポチってしまったよ。WinReaderPro。
読んでここのほうが制度がいいとなると寂しいな。

930 :名無しさん@お腹いっぱい。:2009/02/11(水) 02:48:16 ID:EAl407Ib0
>>928
サンプルで読んでココを使用したが、WinReaderProからすれば
コストパフォーマンスいい、頑張ったな読んでココの開発者
初期段階から比べたらすばらしい成長だ
10分の1以下で買えるじゃん
WinReaderProは買った人はいい買い物だったてことだ、涙涙涙涙だね

931 :名無しさん@お腹いっぱい。:2009/02/11(水) 04:12:39 ID:jOfQULL60
俺は業務用に買ったから良しとせざるを得ないな。
ちょっとの差が検索力の大きな差になると自分に言い聞かせよう。

932 :名無しさん@お腹いっぱい。:2009/02/11(水) 09:30:25 ID:6v8s/SA40
タイピストとか読み取り革命は
画像をでかい文字として認識するのが萎える

933 :名無しさん@お腹いっぱい。:2009/02/11(水) 10:16:43 ID:unbK/L3a0
だってお前ら画像みたいなイラスト文字を認識出来ないとか文句言うから。。。

934 :名無しさん@お腹いっぱい。:2009/02/11(水) 14:42:35 ID:6v8s/SA40
けどほんとに読んでここの方が
winreaderより上なの?

935 :名無しさん@お腹いっぱい。:2009/02/11(水) 15:21:27 ID:EAl407Ib0
>>934
百聞は一見に如かず
購入するなりサンプルでお試しあれ
20.0と1.5万円を選ぶかはあなたしだい

936 :名無しさん@お腹いっぱい。:2009/02/11(水) 15:40:32 ID:jOfQULL60
読んで!ココはxdw文章で取り込みも保存も出来ない。
xdwで文章管理している俺には使いにくい。と自分に言い聞かせた。

937 :名無しさん@お腹いっぱい。:2009/02/11(水) 23:12:24 ID:QPs/OlSQ0
英語の本一冊まるまるスキャンしてPDF化して透明テキスト上から貼り付けて検索可能にするソフトって何が最適ですか?
ドキュワークスというのに興味がありますがそれでも出来ますか?

938 :名無しさん@お腹いっぱい。:2009/02/11(水) 23:24:33 ID:Jf+KINfc0
OCRは自分で試して納得するものを使うしかない
どれがいいのかって言われてもナ

>>1にソフトあるけどバージョンで認識率違うし評価も人によって変わるから
比較するなら
アドビのPDF
読んde!!ココ(エプソンのスキャナに良くバンドルされてる)
読取革命(ソースネクストのものは同じエンジンで過去のバージョン)
e.Typist(キャノンのスキャナに良くバンドルされてる)

939 :名無しさん@お腹いっぱい。:2009/02/11(水) 23:54:35 ID:jOfQULL60
>>937
俺は専門書を数百冊電子化しているよ。
Acrobatは普及しているけど、使い勝手はドキュワークスが圧倒的に上だよ。
マニュアルなんて無くても使えてしまうくらい直感的で自然な操作系だよ。
内蔵OCRの精度はちょいと遺憾なレベルだから、頑張ってWinReaderProを買いましたよ。
Docuworksから操作できるから便利だよ。検索は全文検索ソフトがついてくるよ。
でも、PDFを検索対象にするソフトは多いけど、Docuworksファイルを対象にするのは少ない。こういうところが残念。

940 :名無しさん@お腹いっぱい。:2009/02/12(木) 00:17:13 ID:2u0hBZRU0
個人でWinreaderはコストパフォーマンス合わない気がする

941 :名無しさん@お腹いっぱい。:2009/02/12(木) 00:25:17 ID:yuIW183B0
>>940
俺は大分悩んだね。でも体験版を使って吹っ切れた。

942 :名無しさん@お腹いっぱい。:2009/02/12(木) 00:53:02 ID:2u0hBZRU0
2万くらいのソフトより精度だいぶいいん?

943 :名無しさん@お腹いっぱい。:2009/02/12(木) 02:07:22 ID:yuIW183B0
>>942
うーん、わからないw
DocuWorks文章が読み書きできて、DocuWorksから呼び出せるから他に選択肢が無いというのが正直なところ。
いま、800枚くらいのスキャン文章にページ割り振りするために読み込ませているけど、結構早くて、正確だよ。
つーか、当然かw

944 :名無しさん@お腹いっぱい。:2009/02/12(木) 02:18:05 ID:kcxHj7Xu0
>>939
俺は同じ用途でAcrobat 9 Pro。ドキュワークスも使ってるけど、Acrobat
の方が好み。文字の表示がAcorobatの方が読みやすいし、インタフェースが
Acrobatの方が洗練されてるように感じる。マニュアルなしで使えるのも同じ。

WinReaderProの精度が価格分だけすぐれてるのか、俺には確信がないので、
Docuworks+WinReaderProではなくAcrobat+etypistの方を選んだ。

945 :名無しさん@お腹いっぱい。:2009/02/12(木) 03:02:16 ID:h2ij1ZtQ0
ドキュワークスってOCRソフトというよりも複数種類のドキュメントを関連付けて纏めるファイリング機能が主だよね?

946 :名無しさん@お腹いっぱい。:2009/02/12(木) 03:18:13 ID:yuIW183B0
>>945
そう。でも、そこそこ使えるOCRエンジンを搭載している。WinReaderProを買えば、それに置き換えられるから強力なOCRソフト化する。

947 :名無しさん@お腹いっぱい。:2009/02/12(木) 05:25:40 ID:TCNwsYOx0
テキストの強みは携帯でも糞PCでも簡単に読めることだ。糞ソフトはいらねぇ。

948 :名無しさん@お腹いっぱい。:2009/02/12(木) 08:39:20 ID:Vf8Am6GH0
個人用途でDocuWorks+WinReaderProはなぁ・・・
単に本をスキャンするだけでそれはコストパフォーマンス悪いよ

自分はOpticBook3600でe.typist使ってるがこれで十分だわ
画像の扱いはバカだけど

949 :名無しさん@お腹いっぱい。:2009/02/12(木) 08:49:46 ID:yuIW183B0
>>947
OCRなんて書類検索にしか使わないな。
誤認識ををいちいち訂正する暇があるのはニートくらいだろう。

950 :名無しさん@お腹いっぱい。:2009/02/12(木) 09:04:48 ID:TCNwsYOx0
OCRが何か知らない奴ww
というかなんでこのスレいるんだよw

951 :名無しさん@お腹いっぱい。:2009/02/12(木) 09:10:39 ID:yuIW183B0
お前が一番知らないだろう。
OCR対象が10万枚以上という世界は理解不能だろうなw
俺は正規表現で必要な情報を取り出してファイル名にして整理したりするのに使う程度だな。
一部分の抽出だけでも誤認識に悩まされているのに、OCRデータで本を読むなんて正気の沙汰とは思えない。

952 :名無しさん@お腹いっぱい。:2009/02/12(木) 09:36:15 ID:TCNwsYOx0
完全に自分の世界に入ってしまってるな。指摘されてもスレ違いだということに気付かないらしい。
10万枚以上が要件だから理解不能ってどんだけ無知なんだよ。それならそれ用のシステム構築するだけだろ。
だいたい誤認識で悩まされるのは校正しないままだからだろうが。ほんとシステム設計に疎い奴は勘違いした奴が多い。

953 :名無しさん@お腹いっぱい。:2009/02/12(木) 09:47:14 ID:AFe8DDLc0
質問
ご認識は仕方ないとしてそれを補正しやすいものってどんなのがりますか
s510ってスキャンスナップ付属のアクロバット8では文字変更が大変なのよ
透明テキスト付きpdfってあこがれてたんだけど実際体験したら使えなくて幻滅した

954 :名無しさん@お腹いっぱい。:2009/02/12(木) 10:47:57 ID:Vf8Am6GH0
日本語ソースでは諦めろとしか言えん
英語ソース等でようやく透明テキスト付きPDFは実用になる

それでも誤認識するから保険のために画像にテキスト振った
PDFにして保管しておくわけ

図書館で借りた数冊の本を一度にスキャンして校正までする
暇なんてある奴そうそういないし

955 :名無しさん@お腹いっぱい。:2009/02/12(木) 11:31:46 ID:yuIW183B0
>>954
だよね。人力校正なんて必要最小限に抑えないと人的リソースを喰いまくり。無駄の極みだよね。
ギリギリまで絞り込んだOCRデータの校正の労力をほんの少しでも削減するためにWinReaderProまで買っているのにさw


956 :名無しさん@お腹いっぱい。:2009/02/12(木) 15:01:27 ID:TCNwsYOx0
校正程度で無駄の極みか。だから最近の若者は駄目なんだよな。
誤植の多い出版物が多量に出回るわけだ。

957 :名無しさん@お腹いっぱい。:2009/02/12(木) 15:06:44 ID:gOSgjOIS0
まったくさいきんのわかものはかんじばっかりつかってよみにくいったら・・

958 :名無しさん@お腹いっぱい。:2009/02/12(木) 15:13:27 ID:AFe8DDLc0
漢字変換はできるけど漢字を書くのは苦手なんだよな

959 :名無しさん@お腹いっぱい。:2009/02/12(木) 21:20:26 ID:havzq/c+0
このスレで話がかみ合ってない場合って、主に欧文文書を
大量にスキャンして透明テキストpdfにする院生とか研究者と、
それを批判する人でグチャグチャやってるよね。

批判する人はどういう使い方かまったく明らかにしないけど。

960 :名無しさん@お腹いっぱい。:2009/02/12(木) 23:47:31 ID:yuIW183B0
俺は毎日届く取引先からの紙文章をスキャンして整理するため。
OCRデータから特定の条件を満たす単語をそのままファイル名にする業務用ソフトに組み込むためと全文検索用。
どんなに気をつけても行方不明書類は発生するからね。全文検索での手がかり用だから大体あえばいいと割り切っている。
業務で使っていると校正などするのは無駄の極みだよ。趣味で小説を取り込むのとは時間と量が桁違いだよ。
毎日100枚の書類を校正するのは愚の骨頂だ。

961 :名無しさん@お腹いっぱい。:2009/02/12(木) 23:51:04 ID:74i2NMp+0
全文検索するときに誤認文字を補うようなしかけはあるの?

962 :名無しさん@お腹いっぱい。:2009/02/12(木) 23:57:24 ID:OpzflIzm0
全文検索はwidegrep?

963 :名無しさん@お腹いっぱい。:2009/02/13(金) 00:24:15 ID:7IbRYpk30
>>961
>>962
コンセプトサーチの一種のエクスパンドファインダーを使っているから今は仕掛けはないですね。正規表現が使えるのがあれば乗り換えたいですね。
サーチクロスが良かったんですけど、開発中止したので途方にくれてます。私はxdw文章が主なので対応するソフトが少なくて困っています。
最近、everythingを使い始めたんですけど、これがあればファイル名だけでもいいかなと思い始めました。
あらかじめ条件設定しておいて、ファイル名で自動振り分けしていれば、誤認識されて付けられたファイル名のものは振り分けられずに残るし。



964 :名無しさん@お腹いっぱい。:2009/02/13(金) 00:26:43 ID:48tpImUy0
>>959
>、主に欧文文書を
>大量にスキャンして透明テキストpdfにする院生とか研究者

その一人です。でも最近は日本語文献も取り込んでる。
文字種よりも図表の扱いが稚拙で困るのがAcrobat。
別のOCR必須。

965 :名無しさん@お腹いっぱい。:2009/02/13(金) 00:27:22 ID:lehKlrpz0
全文検索する時って何をキーにして検索する?

966 :名無しさん@お腹いっぱい。:2009/02/13(金) 00:32:24 ID:lHK7bfUG0
>>964
何分野?俺も研究者なんだけど数理の方なのでかなりしんどい。

967 :名無しさん@お腹いっぱい。:2009/02/13(金) 00:40:41 ID:7IbRYpk30
>>965
取引会社名の一部とか顧客名の一部とか。かなり当てずっぽうに試行錯誤している。
システマチックな方法があれば知りたいな。

968 :名無しさん@お腹いっぱい。:2009/02/13(金) 01:00:26 ID:CPb90LAdP
文系研究者の端くれでMacユーザなんだけど、
文系分野だと縦書きまで出てくるので尚更困る。

ジャーナルは良いけど単行本の縦書きテキストは
MacOSXのフレームワークじゃだめで、
Acrobatじゃないとちゃんと認識してくれないのがネックになる。

969 :名無しさん@お腹いっぱい。:2009/02/13(金) 06:39:10 ID:gQ1mRyPc0
しかし、変換結果が合ってるどうかわからないまま、それを抽出、統計とって論文に引用されてたらたまらんな。
文系恐るべし。

970 :名無しさん@お腹いっぱい。:2009/02/13(金) 09:31:21 ID:lHK7bfUG0
もう全部を電子書籍にしてもらえればどんなに楽か・・

971 :名無しさん@お腹いっぱい。:2009/02/13(金) 11:58:14 ID:oiPn1qNT0
>>969

972 :名無しさん@お腹いっぱい。:2009/02/13(金) 12:03:41 ID:gQ1mRyPc0
>>971
図星だったかなw
論文データ捏造とかニュースにならないといいね。

973 :名無しさん@お腹いっぱい。:2009/02/13(金) 12:19:14 ID:c6l5Xu280
なんか、気持ち悪いのが湧いてるな。

974 :名無しさん@お腹いっぱい。:2009/02/13(金) 12:21:38 ID:lHK7bfUG0
バイオ系に多いよこういうの。バイオ系はあまり教科書も論文も読まないけど。

975 :名無しさん@お腹いっぱい。:2009/02/13(金) 12:27:25 ID:uZQhx3By0
数学苦手だから生物学者になるってやつ多いよね。

976 :名無しさん@お腹いっぱい。:2009/02/13(金) 12:29:16 ID:uZQhx3By0
物理学者=数学者(コンピュータサイエンス含)>地質学者>化学者>>>生物学者

977 :名無しさん@お腹いっぱい。:2009/02/13(金) 12:31:18 ID:lHK7bfUG0
比べる必要もないけど地質が変なところにいないか?

978 :名無しさん@お腹いっぱい。:2009/02/13(金) 12:33:55 ID:uZQhx3By0
地質学者ではなく土木学者でした。すみません。

979 :名無しさん@お腹いっぱい。:2009/02/13(金) 15:01:16 ID:ugTZXpCm0
地学とかどうやって生活するんだろう。。。

980 :名無しさん@お腹いっぱい。:2009/02/13(金) 15:14:13 ID:lHK7bfUG0
俺の知り合いは環境アセス会社でお手盛り地質調査をやってる

981 :名無しさん@お腹いっぱい。:2009/02/13(金) 15:32:05 ID:uZQhx3By0
金になる順

化学>>>土木>生物≧コンピュータサイエンス>物理

982 :名無しさん@お腹いっぱい。:2009/02/13(金) 17:52:46 ID:ugTZXpCm0
化学ってフラスコ職人じゃね?

983 :名無しさん@お腹いっぱい。:2009/02/13(金) 18:35:52 ID:uZQhx3By0
化学は主に素材とかかな

984 :名無しさん@お腹いっぱい。:2009/02/13(金) 19:19:00 ID:lHK7bfUG0
>>983は化けなの?
化け分野では下付・上付が多いから苦労しそう。
OCRは何使ってる?

225 KB
■ このスレッドは過去ログ倉庫に格納されています

★スマホ版★ 掲示板に戻る 全部 前100 次100 最新50

read.cgi ver 05.04.02 2018/11/22 Walang Kapalit ★
FOX ★ DSO(Dynamic Shared Object)