当社ブログにアクセスいただき、
誠にありがとうございます。
株式会社コンフィックでは、大量のデータ処理を行うことを得意としています。
データとしては、TXT、XML、HTML、PDFなど色々な種類がありますが、テキストデータから用途に応じて加工することが多いため、加工前のテキストをどれだけプログラムで処理をし易いかを常に意識しています。
例えば、
一文の中で見た目を意識し、「改行」を入れていたり、その上でさらにスペースでインデントをしているようなケースでは、それらの情報を取り除く作業からはじめます。
———例:改行とスペースが入っているデータ
報 告 書
平成26年10月21日
先日の会議について、
下記報告いたします。
1.会議要旨
今後の営業戦略について○○部にて検討をした結果、営業
人員の増員を3名予定したいと思います。
その人員の配置については・・・・・。
———
上記の例では、余分なスペース(全角・半角が混在)や改行が入っています。
このままのデータを用いると「報告書」や「営業人員」という言葉で
検索にヒットしない場合があります。
そこで、データベース化やXML化を行う前にテキスト処理をして、
機械処理し易いデータに加工します。
———
報告書
平成26年10月21日
先日の会議について、下記報告いたします。
1.会議要旨
今後の営業戦略について○○部にて検討をした結果、営業人員の増員を3名予定したいと思います。
その人員の配置については・・・・・。
———
このようなテキストに処理をすれば、その後XMLデータやHTMLデータへの変換が容易です。
レイアウトはその後スタイルシートなどにより再現することができます。
Wordなどで文書を作成する際にも、データの流用を意識すると良いと思います。
文書作成やテキスト処理、データ処理に関してお困りの事がございましたら、株式会社コンフィックまでお気軽にご相談ください。
システム開発・運用に関してのご相談、ご用命は、
多くの開発経験がある株式会社コンフィックへ
e-portfolio(eポートフォリオ)、クラウドクラス、e-Legislation、システム開発、データ変換サービス 等
お気軽にご連絡ください。
株式会社コンフィック 代表取締役 齋藤大地
メールでのご連絡はこちらのフォームからお願いします。
迅速に対応いたします。