紙媒体→テキストデータ→マークアップ


システム開発、XML処理のエキスパート集団 株式会社コンフィック


株式会社コンフィックのブログにアクセスいただき、誠にありがとうございます。

株式会社コンフィックでは、XML技術を用いて、データ作成やデータベース構築のサービスを行っております。

紙媒体をXML化して二次利用やデータ公開したいといったご相談をいただきます。

紙媒体からのXML化作業は、
 ・紙媒体をスキャニング(画像化)
 ・画像データをOCR
 ・OCRしたテキストを校正(プログラムによるチェックと手作業で確認)
 ・テキストデータをマークアップ(プログラムによるマークアップと手作業で確認)
 ・XMLチェック
といった工程により、XMLデータ化します。

プログラムによるOCR認識のチェックやマークアップは、文書種類に応じて専用のツールを作成します。
ツールの精度により、手作業部分が効率化されますので、大量データ処理の場合には手作業での修正箇所をツールに反映し、作業を繰り返すことによってツールの精度を上げていく作業サイクルを確立することも重要です。

株式会社コンフィックでは、データ活用やデータ検索機能やデータ更新環境の開発など、お客様のご要望に応じてスクラッチで開発いたします。
データ構築をご検討中の方は、お気軽に株式会社コンフィックまでご相談ください。

【関連記事】株式会社コンフィックの「マークアップ」をテーマにしたブログ一覧


システム開発・運用に関してのご相談、ご用命は、多くの開発経験がある株式会社コンフィック
e-portfolioeポートフォリオ)、クラウドクラス、サイトワンド、e-Legislationシステム開発データ変換サービス 等
お気軽にご連絡ください。


株式会社コンフィック 代表取締役 齋藤大地
メールでのご連絡はこちらのフォームからお願いします。
迅速に対応いたします。