ScanSnap SV600インタビュー:「本でも名刺でも1プッシュスキャン」ができるわけ

Masahiro Yamaguchi
Masahiro Yamaguchi
2013年07月24日, 午後 07:10 in ScanSnap SV600
0シェア
FacebookTwitter

PFUのドキュメントスキャナ「ScanSnap SV600」の開発現場に迫る3回連続のインタビュー第1回第3回)。第2回である今回は「技術編」として、SV600に採用しているブック補正などさまざまなテクノロジーの秘密を、開発に携わったPFUの本川浩永部長(イメージビジネスグループイメージプロダクト事業部第二技術部)、久保諭氏(同事業部商品企画部)、高畠昌尚氏(同事業部開発技術部専任技術員)、笠原雄毅氏(同事業部開発技術部)、北川光一氏(同事業部ファームウェア開発部)に聞きました。(以下、敬称略)


「1プッシュ」の操作感にこだわった


本川:今回のSV600、ハードもこだわっていますが、同じくらいこだわっているのが、操作系、UI系なんですね。ブック補正などの機能を追加しつつ、ScanSnapの代名詞である1プッシュをどうやって実現するかに非常にこだわりまして。原稿の種類を自動的に判別するのはテクノロジー的に難易度が高いのですが、本だろうが名刺だろうが、とにかく置いたら1プッシュというのを目指そうと。

PFUの本川氏(イメージビジネスグループイメージプロダクト事業部第二技術部)

北川:1プッシュで、製本状態にある書籍(ブック)と裁断処理した書類(カット)とを自動的に判断させようと頑張っていたんですが、歪んでいる原稿を置くと「ブック」と判別することがどうしてもありまして、1プッシュのあとにどちらなのかを確認する仕組みになっています。

Engadget:読み取ったあとに上下のどちらかを選択する、あの画面ですね。

北川:そうです。


本川:実はあれは、サクサク感を失わせないために、裏で2つの処理を同時に走らせているんです。1プッシュした段階では、ふつうのブックかカットかは自動で判断できないので、ひとまず両方の処理を走らせて、利用者が手動で選んだときには裏では全部処理が終わっているんですね。なので、選ぶという操作は確かに1回入りますが、利用者からすると今までと同じくらいのサクサク感で読める。

Engadget:つまり、ブックか通常原稿かを選ぶ画面が出てきている時、バックグラウンドでは両方に対する処理を先回りして実行し、一方を選んだ段階でもう一方を破棄すると。

北川:そうですね。

本川:ブックの処理は、実はすごく複雑な処理をしているんですね。富士通研究所と共同研究をしなきゃいけないくらいの(笑)。それでいて、1プッシュのサクサク感を損なわないために、非常に苦労したという。利用者から見ると当たり前のことに見えてしまうんですけど、ハードと同じくらいこだわっているところですね。

Engadget:1プッシュといえば、今回、ScanSnap ManagerやOrganizerは、従来とほとんど見た目が変わっていないですよね。よく新しい製品が出てきたときにインターフェイスをまるごと刷新することがありますが、今回は見た目がほとんど同じで、ちょっとびっくりしました。いまのお話に出てきたブック補正は、あれはどのソフトで行なっているんでしたっけ。

北川:歪みを自動検出して、黒く色をつけるところまではManagerでやっています。補正や指のポイントレタッチは、あとの操作のUIが担当ですね。

本川:今回、ブック補正という新しい機能を入れたわけですが、それはManagerからも呼び出せますし、Organizerに保存したあとで戻ってくることもできますし、あとあまり知られていませんが、楽2ライブラリからも戻ってこられる。それぞれのソフトがばらばらのことをしているのではなく、ブック補正という一つのテクノロジーのところに戻ってきて、同じ操作感で使えるのは、ひとつのこだわりですね。

「この辺りに輪郭線がある」という箇所に自分で線を描く



Engadget:ブック補正では、本のページの輪郭を自動抽出して、Photoshopのマグネットツールのように境界線を引いて形状を補正するわけですが、開発の苦労などはいかがですか。

笠原:中国に1年以上行って、現地の研究所と協力して作ってきたんですが、最初のうちはまったく精度が出なかったんです。今回、最終的に完成したものは「線が弱いな」と思ったら「もっと強くしよう」とか、「途切れているな」と思ったら「もっときれいに直してあげよう」と、内部でそれこそ100ステップくらいのジャッジをしているんですよ。そういう細分化をすることによって、利用者が「あ、いい感じだな」と感じる輪郭線を出せるようになっています。最終的に諦めたときだけ「やっぱり手動で直してください」となるわけです。

高畠:たとえばこういった本(編注:厚みのあるハードカバー)だと、普通のソフトだとどうしてもここ(外側=赤破線)を輪郭として抽出してしまうんですね。でも我々のソフトはきちんとこの内側(緑破線)を抽出しようとする。本当に欲しい内側を自動で選ぶことにはすごくこだわっていますね。

Engadget:画像処理ソフトを使った場合、レベル補正やコントラストの調整によって、目に見えにくい境目がくっきりすることがありますが、いまおっしゃったページの重なった部分の輪郭検出は、そうした方法では見つけにくいですよね。どのように検出しているのか気になるのですが。

笠原:これまでのやり方は、輪郭が垂直だと判断したら垂直の線を見つけよう、そのためにはコントラストを上げてエッジを見つけようとか、そういう定石的なやり方だったんですが、その点今回は非常に賢いやり方をしています。コンピュータービジョンのやり方なんですが、人間らしい知識を与えるんです。機械的にまっすぐな線を見つけるのではなく、「だいたいこの辺りに輪郭線があるだろうな」と思ったらそこにフォーカスして、自分で線を描いてみて、「あ、これは本らしい形だな」と。そういう賢いことをいろいろとやってるんです。

今言ったのはかなりオブラートに包んでいるので、ちょっと誇張したところもありますが、漫画のように輪郭がぐちゃぐちゃな場合もそれなりに抽出できるのは、人間らしく探しているからです。本当は「こんなにたくさんやっている!」と画像処理の膨大さを1つずつ見せて説明したいくらいです。

Engadget:どちらかというと、「文庫」「コミック」「雑誌」のようなパターンを内部に持っていて「これに近い」というふうに判別している形なんでしょうか。

笠原:中身のアルゴリズムの話なのでちょっとオブラートに包んで説明しますが、どんなパターンが来ても、今回の画処理は働きます。なぜかというと、もう何千枚というケースを機械的に学習しているからです。もし機械学習した中にモデルがなくても、自分自身でそのモデルを作り出してフィッティングするので、(読み取り範囲をはみ出るような)極端な本でもない限り、ほぼ百発百中で見つけられます。

笠原氏

久保:論理的に計算して判断している部分もありますけど、最後はいろんなサンプルを読んで一個一個潰していくという、泥臭いことをやっています。その中で特徴や傾向を把握して、最適なパターンを覚えていっていると。

笠原:人の目で見ても、いちばん端の部分というのは目立つじゃないですか。でも、それを(正しい輪郭とみなして)補正をしたとしても、利用者が求めるものとは違うわけです。だからさっき久保も言ったように、なるべくきれいな輪郭をとれるように、いろんなサンプルを読んで傾向を把握して、さらに角が丸かったり、折れていたりといった状況まで想定して、バランスを修正しています。だから輪郭抽出には自信がありますね。

Engadget:なるほど。ぜひそこを見てくれという。

笠原:ただ、まだ100%でない場合があるので、黒背景のマットを敷いていただくと。でもあれは単にコントラストを上げるためなので、逆に黒い本だったら白い紙を敷いてくれたほうが精度は上がります。

Engadget:たしかに、雑誌のページなどでは、背景が白のほうがうまく検出できたことがありました。

笠原:そうです。ただ、Engadgetの読者には技術系の人も多いですから、「俺は赤背景のシート使ってるよ!」とすでに試している人もいるかもしれません。ガラスの板で上から押さえる人も出てくると思いますし。

久保:ScanSnapには、白紙削除とかモノカラー判別とかいろんな自動化機能がありますが、最初から全部搭載されていたわけではなく、製品を出して利用者に揉まれて、クレームを一個一個つぶしていって今の認識率があるわけです。今のSV600のブック補正もこれからもっとよくなっていくでしょうし、そういった声も聞こえる立場にいるというのが我々の強みですね。世界で一番売れているのでクレームも一番多いですし、世の中の利用者が読んでいるものを一番知っているメーカーでもあるので、そういったことが他のメーカーには負けない自動化精度につながっていると思いますね。

Engadget:なるほど。世界でいちばん売れているというお話が出てきましたが、たとえば他の国では特殊なニーズや使い方があったり、この国ならではのクレームや要望というのはあるものなんですか。

久保:ADFでの話になりますが、とくに多いのが紙質についてですね。中国の紙は薄くてザラザラしたものが多く、ADFでは分離できないような紙もよくあります。あと寒冷地だとマイナス何十度とか、我々が想定できないような環境でスキャナーを使ったり、アジアの新興国であれば砂がたくさん舞って光学系が汚れやすいといった傾向もあります。

もちろんカタログなどにはこうした動作環境について断り書きを入れていますが、利用者はまったく気にせず使うわけです。我々はそうした利用者の声を聞きながら「じゃあどうしようか」と改善していますので、結果的にすごくいろいろな環境を把握できますね。

わざとボケさせるという逆転の発想


Engadget:いわゆる書画カメラでは、本を見開きのまま読み取れてもピントが合っていないことがありますが、今回のSV600はいろいろと条件を変えながらスキャンしてもまったくボケない。あれはどういうテクノロジーによるものなんでしょう。単にCCDを採用するというだけでは、ああはならないと思うのですが。

本川:そこは逆転の発想でして、くっきりしたものだと少しでもズレるとボケるんですよね。それは仕方がないんですが、逆にボケているものであれば、多少ずれてもボケたままじゃないですか。そこなんですよね。それを復元させるテクノロジーを使っていることで、多少ボケても復元させたら同じように見えるわけです。書画カメラや、CISを利用したスキャナのほとんどは少し紙が浮き上がっただけでボケちゃうんですけど、これはボケた画像を利用しているので、少々高さが違ってもボケ具合は一緒なんですね。だから復元させることで同じようにくっきりできると。

高畠:特殊なハード、つまりレンズと、専用の画像処理によるものですね。

本川:くっきりからくっきりを出すんじゃなくて、ボケからくっきりを作る。わざとボケさせるという、逆転の発想ですね。

Engadget:それは興味深いところですね。光学解像度は今いくらでしたっけ。

本川:300dpiですね。出力的には600dpiなんですが、300dpiから作り出しているので、光学的には300dpiです。

Engadget:ということは、(カラー600dpiの)エクセレントモードで取った場合も、300dpiで取ったものを加工して600dpiにしているということですね。

本川:はい。よくレビューで「エクセレントにしてもそれほど画質が...」という話があるのはそういった理由ですね。元々の光学解像度が300dpiなので、エクセレントにしたから大幅に画質がぐんと上がるというものでもないですね。ドキュメントは300dpi前後がいちばん読みやすいので、従来で言うエクセレントの600dpiなどは、ドキュメントスキャナとしては実はそれほど重要視していません。

Engadget:斜め上から読み取った場合、原稿の手前と奥とでは、ヘッド部からの距離が異なりますよね。それについても、今のお話にあった仕組みで補正されているんでしょうか。

本川:はい、距離が長い方が解像度が落ちる方向にありますので、なるべくそれを利用者に感じさせないような画像処理等の組み合わせをしています。非常に苦労したところですね。

さまざまな原稿が読めてしまうがゆえの要望


Engadget:ブック補正をいくつかの原稿で試してみたところ、もとの原稿よりも若干横方向に伸びる傾向があると感じたのですが、縦横比率は現状どのように測定しているんでしょう。

本川:ここがまだブック補正が完璧ではないところでして、形は分かるのですが高さの情報がなかったりと、見ているだけではわからない情報は実はたくさんあるんですね。なので、いくつかの情報は推測が入っていて、「こうじゃないか」と引き延ばして見やすい形にしているので、本物との縦横比が若干違う。これを今後どのように改善していくかはひとつのポイントだと思っています。

Engadget:なるほど。ほかに試してみた原稿では、スケッチブックに鉛筆で薄く書かれた線が読みにくいようですね。スケッチブック自体のサイズは問題がないんですが、あまり濃くない、実線までいかないような薄い線が読めない。

久保:デッサンのような。

Engadget:そうです。デッサンやクロッキーはたいてい白く飛んでしまう。こうした原稿を読み取るための解決策が何かないのかなと思ったのですが。

北川:8月頭くらいに予定されているアップデートで、そういった色を飛ばさないためのモードを用意します。ちょっと暗くなっちゃうんですが、(ディティールの)欠落はなくなりますね。

本川:もともとドキュメントスキャナーとして、背景を飛ばす方向でいままで画作りをしていたという経緯があるんですね。そのほうがたいていのものは裏写りがなくなって読みやすいんですが、その影響で薄い線はどうしても飛んでしまう。なので、そういった薄い線も飛ばさない、つまり忠実に再現すると言ったほうが正確なんですが、そういったモードを実装する予定ですすめています。

久保:いろんなものが読めるからこそ、そういう要望が出てくるんですよね。(iX500などの)ADF方式であれば、そこまでの要求はないですからね。

(次回「テクニック編」につづく)

 

TechCrunch 注目記事新型コロナのソーシャルディスタンスを支援するビデオチャットアプリ8選

 

新型コロナウイルス 関連アップデート[TechCrunch]

 

関連キーワード: ScanSnap SV600, ScanSnap SV600 interview, ScansnapSv600, ScansnapSv600Interview
0シェア
FacebookTwitter