当社ブログにアクセスいただき、
誠にありがとうございます。
株式会社コンフィックでは、様々な文書のデータベース化やデータ作成業務を行った経験があります。
日本語の場合、古い紙文書はほとんどが縦書きで書かれています。それらをデータ化する際には、日本語の認識が優れているOCRソフトを用いてテキスト化を行います。
縦書きには横書きには無い、全角2文字分の繰り返し記号や傍線があることもあり、テキスト化する際には注意が必要です。
また、古い書籍や人名地名が多く出てくるものをテキスト化する際には、文字種が無い場合もあり、どのような代換文字を用いるか、画像で表示するのかなどをルール化しておく必要があります。
スキャニングするだけではなく、テキスト化までを行うことで多くの用途に活用できるデータになります。
テキスト化されたデータを再度縦書きに組版することや、ブラウザにて縦書き表示することも可能です。
データベース構築、データ作成、活用方法などお気軽に株式会社コンフィックまでご相談ください。
【関連記事】株式会社コンフィックの「電子化」をテーマにしたブログ一覧
システム開発・運用に関してのご相談、ご用命は、
多くの開発経験がある株式会社コンフィックへ
e-portfolio(eポートフォリオ)、クラウドクラス、e-Legislation、システム開発、データ変換サービス 等
お気軽にご連絡ください。
株式会社コンフィック 代表取締役 齋藤大地
メールでのご連絡はこちらのフォームからお願いします。
迅速に対応いたします。