株式会社山と溪谷社様

非破壊電子化 自動OCR

目指すは“究極の図鑑”~”複数図鑑の横断検索“とコミュニティの力で作る『図鑑.jp』の魅力~

2018年7月。その創業以来刊行されてきた月刊『山と溪谷』が創刊1000号を迎えました。山岳・自然分野において日々感動と学びを届けておられる株式会社山と溪谷社様は、1930年の創業から今年で88年の伝統ある出版社様です。


一方月刊『山と溪谷』同様、事業の“柱”として全国の生物研究者や愛好家に長く活用され続けているのが、美麗なカラー写真が高く評価されている同社の実用図鑑。同社のWebサービス『図鑑.jp』は、そんな図鑑領域における革新的なサービスとして昨年1月に公開されたものです。


誠勝では、この『図鑑.jp』掲載用の図鑑の電子化をお手伝いしています。


同社のデジタルコンテンツ、『図鑑.jp』、そして同サービスを取り巻く人々と背景について、株式会社山と溪谷社 自然図書出版部 部長 デジタル事業推進室 室長の神谷 有二様に伺います。

『山と溪谷社』のデジタルコンテンツ

ご所属の『デジタル事業推進室』が設立された背景は何でしょう。

神谷様:山と溪谷社のデジタル事業としては、2010年に開始した登山情報サイトの『ヤマケイオンライン』が大きいのですが、それ以前からさまざまなデジタル事業が増え、プロジェクト単位で社内横断的に色々な案件をやってきました。メーカーさんの製作する電子辞書へコンテンツ提供や、単行本にならない短期の連載をデジタルの小冊子で発行していたこともあります。案件も増えてきたため、そろそろ一個一個のプロジェクトでやるよりは、新規事業という意味も含めて部署を作らないかということになりまして。

神谷様

私は入社以降、図鑑を制作する自然図書出版部や月刊『山と溪谷』の編集などを歴任してきました。そんな中、2013年に『ヤマケイオンライン』を担当していた際に、電子書籍やアプリ等、色々なデジタルコンテンツをリリースする部署として新規事業開発室ができ、2016年にデジタル事業推進室という名称に変更して、今は自然図書出版部と兼任する形で室長を務めています。

『図鑑.jp』が従来の図鑑を救う、変える

『図鑑.jp』をローンチした背景について教えていただけますか。

神谷様:元々、図鑑は一冊あれば何でも分かるという事は無く、複数の図鑑を並べて調べるような使い方をするんです。図鑑の著者が違うと生物を見るポイントが違い、写真も違う。複数の図鑑を同時に使い、全部を見た上で『これだ』と判断していたんですね。
また、例えばこのアブラムシの図鑑(下写真左)は現在は絶版なのですが、出版当時のアブラムシの究極の情報が集約されています。その後、このような専門図鑑は出版されておらず、いまでもここにある情報はとても重要なのです。ある意味、専門性の高い図鑑は、日本社会の“共有知”なんですね。論文でも参考文献として出てくる一次資料なんです。


ところが時代の流れの中でこうしたいい図鑑が重版出来なくなり、手に入らなくなっています。これまで専門性の高い図鑑でも “商業出版”が成り立っていましたが、それが危うくなってきた。出版社側も、絶版した図鑑についてお問合せを受けても重版を渋ってしまうのです。
一方で、最新の研究は論文でアップデートされ高度化されていくのに、図鑑は出版されないので、研究者と愛好家と乖離がどんどん進んでしまうんです。


そんな時、そんな複数の専門図鑑をデジタルコンテンツにし、しかも外へ持ち運ぶことの出来る『図鑑.jp』の提案をしたところ、出版社の皆さんからも『面白いね』とポジティブに捉えていただき、図鑑をお借りした上で電子化させていただいたんです。

そのままスキャンで電子化した図鑑
▲今回電子化させていただいた図鑑の一部

具体的にどういったサービスなのでしょうか。

神谷様:電子化した複数の図鑑を横断検索出来るサービスです。現在は9社2機関からご提供いただいた図鑑を計47冊掲載しており、弊社の図鑑も18冊ほどあります(2018年8月20日時点)。これらをジャンルごとに読み放題にするサービスです(年額と月額の2つのコース)。

『図鑑.jp』のキャプチャー画像

例えば『セイヨウタンポポ』を検索すると、このように複数の図鑑から『セイヨウタンポポ』の情報が表示されます。各図鑑には個性があるので、こっちの図鑑はどう書いているのか、ここがよく分からないから他の図鑑を見てみようなどと比べて眺めることが出来る。紙の図鑑を並べて比べていたこと、まさにそれ自体が機能になります。Google Scholarとも連動しており、そのまま論文を探すことも可能です。


ただ、こうした図鑑は中・上級者向けなので内容的には難しかったりします。また図鑑=全国版を作るという背景から、季節や地域に関する『いつ・どこ』の情報や、花で言えばつぼみや枯れた姿などの写真などが物理的な制約で載せられないということもある。
そこを補い“究極の図鑑”を目指すというコンセプトから、『図鑑.jp』では投稿機能を設けています。また、一般の方が植物や鳥類に関する疑問を掲示板にすると、専門の方が回答してくれるサービスも用意しています。乖離が進んでいる研究者とアマチュア同士がコミュニティで教え合ったりする形で作っていき、図鑑にはない情報を投稿で補う。それを含めて『一つの図鑑』とすることを目指しています。

それまで“プロ”だけが関わっていた図鑑の作成に、一般の方も参加できると

神谷様:先日、鳥の脚一本しか映っていない写真を投稿した方がいらっしゃったんですが、一体何の種類なのか我々が誰も分からない中、研究所に所属する方が丁寧に解説してくださったことがあったんです。一般の方が図鑑を見ても分からないような疑問に専門家が答えてくれる。それを学べる場所は他に無いですよね。
単に『紙の図鑑がデジタル化されていて、良いよね』だけではなく、全体像を描いた上で運営しているのが『図鑑.jp』になります。

電子化と将来を見据えたテキスト化

今回は『図鑑.jp』に掲載する図鑑十数冊をご依頼いただきました。

神谷様:元々、別の部署で登山道具や鉄道の書籍を電子化いただいており、そちらからの紹介でした。
出版社さんに負担をかけない状況にしたかったので、綺麗な画像でなければ話になりませんし、特に傾きや色、容量の問題もありましたが、コストとの着地点をどこに置くかという判断が非常に大きくありました。

OCR処理もご依頼いただきましたが、その目的は?

神谷様:2つあります。
1つは『図鑑.jp』は名前でデータベースを連動させているので、図鑑の索引ページにOCRを施して『学名』と『和名』を抜き、そこからデータを作って紐づけること。
もう1つは、例えば花の色等を入力すると探せるような “全文検索”を出来るようにしたかったというのがあります。その為にテキストデータとして欲しかった。将来的には『図鑑.jp』で全文検索出来る、その可能性を考えています。

紙との違いを訴求する

ローンチから1年半経ちました。

神谷様:利用者数はローンチ後から安定的に伸びています。会員の継続率は、大学や環境アセスメント会社といった法人様はほぼ100%、個人の方も平均80%がご継続いただいており、ご利用されている方にはご満足いただいています。

神谷様

一方で、このジャンルの書籍は数が多い訳では無く、古い図鑑に関しては著作権者の方をたどり切れないということもあります。最近の図鑑では、一つの本に著者が100人くらいいることがあり、過去に遡ったり電子化するのが難しいという問題もある。
また面白いことに、野鳥は植物に比べると種類が少なくて各図鑑も充実しているんです。しかし、会員は野鳥の方が少ないのです。ですので『図鑑を沢山集め、ラインナップを揃える』だけでは愛好者様の心の琴線には触れないんですね。


図鑑は、意外とWebで代替されていない領域です。“究極の図鑑”を目指すには多くの人で足りない情報を補完していただく必要があり、その為には紙との違いを訴求する必要がある。将来的にはあらゆる声、あらゆる可能性を視野に入れていこうと考えています。

●図鑑.jp:

https://i-zukan.jp/

図鑑.jpロゴ
株式会社山と溪谷社
設立
1930年4月1日
事業内容
山岳、自然等に関する雑誌・書籍の出版販売
HP
https://www.yamakei.co.jp/