平成26年4月8日

「自炊」について

 

今回のコラムは、自炊についてです。といっても、こにたんが単身赴任先で、生協で食材を取って自炊をしているとかいった話ではなく、数年前から流行っている、本をスキャナで取り込んで、携帯情報端末などで読むという「自炊」です。
この「自炊」が流行りはじめたのは、iPadの登場と無縁ではないでしょう。あのような薄くて軽くて持ち運びが苦にならない端末を何に使うかと考えたとき、その使い道の一つに、外出先で本や漫画を読むということがあったのだと思います。もっとも、ほぼ全盲のこにたんは、あのようなのっぺらした機器が到底使いこなせるとは思えないし、寝ている時と飯を食っている時以外はずっとパソコンを触っているので、外出したときぐらいは電子機器から自由になりたいという欲求があります。それに最近肩凝りがひどく、あのようなものを使っていると余計に肩が凝りそうです。ですからiPadは使っていないし、スマフォすら持っていません。そのため、こにたんは今流行っている「自炊」を論じる立場にはありません。ではなぜ今回のコラムに「自炊」を取り上げたのかと言えば、我々全盲の人の多くが、「自炊」が流行るはるか以前から「自炊」していたという事実があり、その内情を一般の人にも知ってほしいと思ったからです。
ところで、この「自炊」という言葉、こにたんの感覚ではなかなか本をスキャナで取り込むという行為に結びつきません。皆さんはいかがですか。この言葉の出所を調べてみると、その昔、ゲーム機などからソフトウェアを抜き出してパソコンなどで使えるようにする行為を「自分でソフトを吸い出す」という意味で「自吸い」と呼んでいたとかで、これを本からデジタル情報を吸い出す行為にも当てはめ「自吸い」→「自炊」となったとか。また別の説では、スキャナが本を自動的に吸い込んでいく様子を「自吸い」と呼んだとも言われているそうです。知らなかったなあ。
さて、こにたんの目の病気である網膜色素変性症(略称を「色変」といいます)は、網膜の細胞が徐々に死んで数年から数十年かけて視力が衰えていくというものですが、だんだんと目がかすんでゆくなかで何がつらかったかと言えば、読書ができなくなることでした。最初のうちは、行を下まで読んで次の行に目をやると、何かつじつまが合わない。よく見てみると、別の行を読んでいた。そんなことがよくありました。色変はだんだんと視野が狭くなっていく病気なので、本の全体が見えなくなり、行を飛ばして読んでしまっていたのです。やがて中心視力も弱まってくると、大きなルーペが必要になってきました。しかし、文字を拡大したからと言って、読書が楽になるわけではありません。読書は、一文字ずつ活字を拾っていく行為ではありません。読書は連続した文字をかたまりとして読む行為であり、一文字を読みやすくするとともに、連続した文字もある程度は見えなければなりません。しかし、色変は視野が狭くなるわけで、文字を拡大すると余計に連続した文字が見えなくなるのです。こうして、こにたんは2000年頃になるとルーペで文字を読むこともつらくなってきました。こにたんがスキャナを使って読書を始めたのは、この頃からです。
将来こういう時期が来ることはわかっていましたので、こにたんはそれ以前から視覚障碍者の読書の方法についていろいろと研究をしていました。視覚障碍者が読書をするには、まずスキャナで本を画像として読みこみ、これを活字OCRでテキスト化して、スクリーンリーダーで読ませるという作業が必要になります。参考になるかどうかわかりませんが、こにたんが今の読書環境に至った経過を記しておきたいと思います。
まずスキャナですが、こにたんがパソコンで読書を始めた頃にはWindowsが普及を始めて10年近くたち、その頃にはスキャナは満足できる性能のものが3万円前後と安価になっていました。しかしその頃はまだ今のようなドキュメントスキャナはなく、ガラス面に本を置いて読ませるフラットベッド式でした。紙を自動送りするADFはありましたが、ややもすると本体よりも高価であり、こにたんには買えませんでした。こにたんが最初に買ったスキャナは、エプソンの「GT-7600」という機種でした。
このフラットベッドスキャナで本をスキャンすることを始めたのですが、分厚い本になると、ページの継ぎ目の付近で画像がぼやけてしまい、うまく認識されません。また、本をガラス面に押し付けるバランスが悪いと、左右のページの角度が変わってしまい、これまたうまく認識できないことがわかってきました。そこで、本を一枚ずつ破いてスキャンすることを始めました。本のおもて表紙とうら表紙を180度開いて右手に持ち、中身のページ全体を左手に持って、エイヤッと力を入れて、表・裏表紙を背表紙もろとも本体から切り離します。そうして、中身のページを1枚ずつ破いて、スキャナにかけるわけです。表紙と本体を切り離す際、うら表紙の開き加減を少し浅く、すなわち170度程度にし、おもて表紙の開き加減を少し深く、すなわち190度開くことで、背表紙と本体のつなぎ目の隅に力を集中させるようにします。こうすることで、ハードカバーのような頑丈な本でも、比較的弱い力で表紙を外すことができます。
高価な本をこのような乱暴な方法で破くことに最初は躊躇しましたが、本の価値は情報にあり、物理的な紙の形にあるのではないと割り切りました。やがて、本をきれいに裁断できるロータリーカッターなるものがあることを知り、Rionの「RC-A4」という裁断気を購入しました。Rionの事務機は、質実剛健といいましょうか、デザインは無骨ですが、頑丈で性能的にも信頼がおけるものが多いので、会社でも好んで購入していました。こにたんが買ったものは、40枚を裁断できる製品でしたが、この当時売値で1万円そこそこで40枚裁断できるものは、他にはなかったように思います。このロータリーカッターを買ってからも、表・裏表紙を外すやり方は同じですが、中身のページは40枚程度をまとめて破き、一括して裁断できるようになりました。
次に買ったスキャナは、キャノンの「DR-2580C」という機種で、2005年のことでした。このスキャナはADF機能付きで、紙の両面を一度にスキャンできる、ドキュメントスキャナと呼ばれるタイプでした。非常に高速でかつコンパクトでしたが、値段の割には問題の多い製品でした。その問題とは、2、3枚をダブって吸い込むことが度々あったことです。また少し斜めに吸い込むこともしょっちゅうでした。斜めに吸い込むことについては、ソフトの側である程度は補正できますが、ダブって吸い込むことは悩ましい問題でした。目が悪いコニタンには、いつダブりが発生したかがわかりません。全部スキャンした後で、ページが飛んでいるとがっくりです。しかたがないので、吸い込まれる次の紙を指で押さえておき、ダブりが起きないようにすることにしました。高速に吸い込まれていく紙の流れに遅れないよう、次の紙、次の紙と押さえていくには、かなりの技術が要求されます。おかげで最新式のドキュメントスキャナに、指サックが必需品となりました。まったく、手間のかかるやつでした。とはいえ、この両面を一度にスキャンできるドキュメントスキャナの登場は画期的で、こにたんの読書環境は格段に向上しました。
ちょうどこのスキャナを買った頃、妻が大学院に入り、福祉系の歴史の研究を始めました。そのため、このスキャナは、コニタンの読書のためというよりも、もっぱら妻の研究資料のスキャンのために活躍してくれました。妻の資料をスキャンするのは、もちろんこにたんの仕事です。1、2年たったある日、パソコンの画面にスキャナのローラーの交換を促すメッセージが表示されました。調べてみると、10万枚スキャンするとそのメッセージが出るようでした。4、5年たってこのスキャナは壊れてしまいましたが、それまで2回はローラー交換のメッセージが出ましたので、30万枚近くをスキャンしたことになります。フーー。
次のスキャナは、2010年頃に買ったキャノンの「DR-2510C」でした。世の中で「自炊」が流行りはじめたのは、この頃だったと思います。富士通のスキャナが売れ筋でしたが、後で触れる活字OCRとの兼ね合いもあり、前機種の苦い経験にもめげず、キャノンのスキャナを選びました。このスキャナは前機種よりもかなり安価でしたが、紙のダブりを超音波で検知する機能が備わっていました。それまで数十万円もする上位機種にしかついていなかった機能ですが、売値5万円そこそこの機種にまでこの機能が付いたのは、画期的でした。この超音波重走検知機能は優秀で、これまで数十万枚をスキャンしましたが、検知漏れは全くありません。これでやっと、指サックからおさらばできました。また斜めに吸い込むことも少なくなり、こにたんの読書環境は格段に快適になりました。
次に活字OCRですが、こにたんがパソコンで読書を始めた頃には、「e。Typist」、「読んでココ」、「読取革命」、「読取物語」など多くの活字OCRがあり、視覚障碍者専用に開発されたソフトや機器も販売され始めていました。このうち、視覚障碍者専用のものはそれなりに使いやすかったのですが、残念ながら高価でした。またスクリーンリーダーに非対応のものも論外です。そうすると残りは限られ、メディアドライブのe。Typist、リコーの読取物語、後にエプソンに買収された読んでココを一時は併用して使っていました。しばらくは、バージョンアップのたびに体験版をテストしていましたが、最終的に残ったのはe。Typistでした。このe。Typistはバージョン6の頃から使っています。このソフト、新聞の段組みがうまく認識できないといった問題はありましたが、活字だけなら認識率も高く、しかもスクリーンリーダーにほぼ完全に対応しており、大変使いやすいソフトです。V11だったか、アプリケーションエラーが頻発するできの悪いバージョンもありましたが、今ではV15となり、製品は安定しています。ただし、ここ数回のバージョンアップでは、認識率の向上はあまり見られません。「ン」を「ソ」とご認識するなど、認識エンジンにはまだまだ改善の余地があります。アルファベットの認識は完璧なので、ご認識しやすい文字を取り出し、それをアルファベットと同じ方式で慎重に調べることで、さらに認識率は高まるような気がしますが、素人考えでしょうか。今後CPUの処理能力がさらに向上すれば、日本語の認識も完璧に近づくものと期待しています。なお、このe。Typistには、傾きが微妙な場合、傾き補正が行われず、行の途中から別の段と判断され、行の後半部分が前半部分よりも前に来てしまうという問題があります。この件に関しては、例えば縦書きの本であれば、横向きでスキャンします。こうすることで、全てのページの縦横をe。Typistに自動判断させ、微妙な傾きの補正の問題を回避するというテクニックがあります。それに横向きでスキャンしたほうが、スキャン時間を短縮できます。
以上、こにたんの「自炊」の歴史についてつらつら書いてきました。視覚障碍者のための活字OCRが出たのは、1980年代でした。最初のシステムは、200万円もしたそうです。こにたんの少し先輩は、そのような黎明期を経験され、多くの努力と失敗を経てこられました。やがてその研究が市販の製品に生かされ、こにたんの快適な読書環境へとつながっているわけで、先人の努力に感謝しないわけにはいきません。今では、300ページほどの文庫本なら、10分もあればパソコンに取り込むことができ、活字だけの本なら、ほとんど問題なく読書が可能です。ルーペで苦労して読書していた頃に比べ、夢のようです。これとネットで本を注文できる「amazon」のようなサイトの登場や「日本の古本屋」などの古本市場の充実と相まって、読む本の数は目が悪くなる前よりも増えたぐらいです。視覚障害は情報障害と言われますが、活字OCRやドキュメントスキャナの進歩は、視覚障碍者の情報障害をかなりのレベルまで克服してくれるものとなっています。すなわちこれらは、情報のバリアを取り除いてくれる、ありがたい機器です。これらの機器の登場により、少なくとも活字情報の範囲では、健常者との差はなくなりつつあります。今後願わくは、公共図書館などで視覚障碍者に本のテキストデータを提供するなど、個人の負担を軽減する政策が実現してほしいものです。今の技術があれば、そのようなことは簡単なのですから。また、この技術が発展して、デジカメや携帯などで撮影した画像から、文字部分を取り出して音声化する手軽なツールが実現してほしいものです。例えば、家電のボタンに付された文字やタッチパネル・ディスプレイの文字、外出した際の看板や案内の文字など、活字OCRの延長で何とかなるものは多いと思います。やがてそのような時代が来ることを夢見て、この稿を閉じたいと思います。

 

戻る

inserted by FC2 system