古文書・論文・原稿用紙
手書きの文書を高精度でデータ化

非破壊スキャン×文字校正でテキスト化

長年の歳月により風化してしまった古文書や、手書きでしか残されていない論文・原稿などから、書かれている文字・情報をデータにするサービスです。
原本を電子化し、国内のスタッフが目視で手書きの文章をテキストデータへと変換致します。
電子化したデータをPDFへと変換し、テキストデータを付与することも可能です。
また、電子化データをお持ちの場合はデータでのご入稿も対応しております。
劣化の進んだ原本を開くこと無く内容を観覧・検索出来るようにしたい、PCの無い時代に作成された貴重な文章をデータ化して保存・活用したいといったご要望にお応え致します。

こんな方におすすめ

縦書き

縦書きの資料だから
OCRが使えない

古文書

古文書などの内容を
データ化したい

原稿用紙

紙原稿をデータ化し
再編集したい

Excel・Word変換

手書きの資料をWordや
Excel変換したい

サービスが選ばれる理由

精度99.96%を保証

文字起こしスタッフ

熟練した日本人スタッフが目視でチェックし、丁寧に構成を行います。最高精度の構成である二重目視では目安精度99.96%を実現、出版社様にもご利用いただくレベルです。

旧字体も対応可能

旧字体のイメージ

外国人の作業員やOCRが苦手とする旧字体の入力・変換も得意としております。戦前の資料や文書のデータ化にも豊富なノウハウがございます。

非破壊での電子化

非破壊スキャニング

そのままスキャンでは様々な非破壊スキャナーを所有しており、資料のサイズ、厚み、状態に応じて適切なスキャナーを採用。劣化した資料も傷つけずにスキャン致します。

縦書き文書にも対応

縦書きの原稿用紙や古書

OCR・AI-OCRでは対応の難しい縦書きの手書き文書二も対応。縦書きで執筆された論文や縦書きが主流だった時代の古文書などは是非お任せください。

手書き文書のデータ化事例

日本放送協会(NHK)様

戦時中の手書きの名簿をExcelデータ化

特番内で使用するためのビッグデータ作成のご相談を頂き、手書きの文章でしか残されていない当時の記録をデータ化。戦時中に記録されたインパール作戦の戦没者名簿から11,716人分の戦死場所や死亡事由など計12項目の内容をExcelデータへと纏めさせて頂きました。

臨済寺様

重要文化財を非破壊スキャン、白文データ化

臨済寺様が所有する静岡県指定重要文化財「鉄山和尚語録」の電子化と白文データ(レ点などの無い漢文)作成をお手伝いさせて頂きました。様々な専門家のご助力を頂き、白文の作成に取り組ませて頂いた他、自治体との文化財持出についての書類手配等も担当しました。また、収録用DVDのパッケージデザインの作成もワンストップで承りました。

料金一覧

文字起こしの方法によって料金が変動致します。下記を参考ください。

  

1.紙の原本からの文字起こし

原本をスキャンし、画像データへと変換した
後校正作業を行います。

スキャン料金+校正料金をご覧ください。

2.データからの文字起こし

PDFデータや画像データを入稿される場合、
校正の料金のみとなります。

料金はこちら

スキャン料金

原本の紙面内容により適切な解像度が変わります。詳しくはお問合せください。

基本料金 1,000円/1回
解像度
画像の鮮明さ
裁断しないスキャン
(古文書・貴重書等)
バラ紙のスキャン
(論文・議事録等)
600dpi 65円~ /1ページ 46円~ /1ページ
400dpi 40円~ /1ページ 18円~ /1ページ
300dpi 30円~ /1ページ 14円~ /1ページ

※原本の状態によって追加料金が発生する場合がございます。

校正料金

校正はプランによって精度・料金が変わります。
精度と校正内容については下記をご参考ください。

一人校正(目安精度:96%)
スタッフ一名が原本の文章を目視で確認しながらテキスト入力を行います。
100円~ /1ページ
二重目視(目安精度:99.96%)
スタッフ二名が別々にテキスト入力を行い、作成されたデータを三人目のスタッフが
特殊なソフトを用いて二つのデータを照らし合わせ、そこで生じた相違点を原本を見ながら修正します。
150円~ /1ページ
校正内容の詳細はこちら

3つの安心

セキュリティ

プライバシーマーク

そのままスキャンはプライバシーマーク(個人情報保護)の認証を取得しており、お客様の個人情報や機密情報などの保護を徹底しています。

法人実績

ご利用企業数

企業や公官庁、大学といった法人のお客様を中心に3,500社を越える電子化実績を持っています。原本の形態問わず、あらゆるお悩みにお応え致します。

非破壊でスキャン

非破壊スキャン

経年劣化など様々な理由でボロボロになった書籍も、熟練のスタッフの手によって丁寧にスキャン。傷つけずそのまま返却致します。

OCR/AI-OCRとの比較

OCRとは?

OCRのイメージ

OCRとはOptical Character Recognitionの略であり、日本語では光学文字認識と表記される技術です。OCRを用いる事で、画像として保存された文字をコンピューターが文字の形として認識し、それに最も近いテキストデータへと変換するという仕組みで、文字のデータ化としては最も安価で確実な方法と言えます。近年では、スマートフォン用で撮影した物にOCRをかけるアプリや、自動で範囲を認識してある程度の表などに纏めてくれるAI-OCRなども登場しています。

OCRと手書きの相性

手書きのイメージ

手書きとOCR

OCRソフトは「文字の形」から「適応する文字」を割り出す都合上、個性の出やすい手書きの文書は非常に苦手としています。一般に流通しているOCRソフトや、スマートフォンのOCRアプリで手書きの文書を読み込んだ場合、精度の高いテキストデータを抽出することはほぼ不可能と言えます。
OCRのための画像化・電子化の部分のお悩みもよく見受けられます。一般的な破壊スキャナーでは、劣化の進んだ古文書や貴重書のスキャンを十分に行う事が出来ないため、OCR処理の前段階から課題が発生するケースが多々あります。

  
AI-OCRと手書き

AI-OCRは縦書きに非対応

手書き文書に特化したAI-OCRも開発されています。年々性能が上昇しており、かなりの精度で文字を認識することが出来るようになりましたが、人間の目視によるチェックを入れることで精度は飛躍的に上昇させることが出来ます。
ですが、現在のAI-OCRはあくまで業務効率改善のために開発されている側面が強く、アンケートや手書きの伝票など、横書きで書かれた文章しか対応する事ができません。日本国内で執筆された昔の資料はほぼ全てが縦書きであり、その場合やはり人間の手による文字起こしが精度の面で確実な方法となります。

  

ご利用案内

問合せ

01 お問合せ

メールまたはお電話でお問合せください

お見積書

02 見積もり算出

枚数、サイズなどで簡単なお見積もりを算出致します

発注

03 発注

お見積もりをご確認いただき、ご発注ください

お預かり

04 資料お預かり

郵送またはお持込にて原稿をお送りください

テキスト化作業

05 テキスト化

お預かりし、電子化したデータをテキスト校正します

データ納品

06 納品

お客様のご要望に沿った方法で納品致します

※紙の原本をデータ化する場合、テキスト化の前に電子化作業があります。

よくある質問

デジタルのフォントではなく、人間の手によって書かれた文字をデータにする作業を指します。手書き文字は個人の癖が強く、OCRソフトでの認識が極めて難しいです。
近年ではAI-OCRの技術向上により手書き文字の認識率も上がっているものの、あくまで帳票やアンケートなど横書きの文書に用途が限られています。そのままスキャンでは古書や旧字体などの縦書き・旧字にも対応するデータ化サービスを提供しております。

そのままスキャンでは400年前の重要文化財を非破壊でスキャン、文字をテキスト化し一切傷つけずお返しした実績がございます。安心してお任せください。
ただし、書籍の状態や仕様上どうしてもスキャニングできないケースもございます。まずは担当へご相談ください。

文字入力を行う人数によって変動致します。一人校正の場合は96%、二人校正は99.96%を目安精度として保証しております。

スキャンした書籍データを見ながら手入力でするほか、AI-OCRを利用することもございます。ただしOCRは縦書きに非対応なため、横書きがメインである日本国内の古書・貴重書や原稿の文字起こしは手入力および校正を行う形となります。

手書き文字のデータ化は書籍のレイアウトや手書きの種類、お求めの精度、納期等によって料金が変動致します。まず概算を知りたい方はinfo@sei-syou.comまで対象書籍の中身(数ページ程度)のお写真をお送りくださいませ。速やかに担当よりご連絡致します。