1-F-6-2 第17回医療情報学連合大会 17th JCMI(NOV,.1997)

SGMLによる構造化された医薬品添付文書の記述

中橋 望 , 斎藤 真一郎 , 篠 道弘 , 松本 裕子 , 西城 一翼 , 折井 孝男 , 水島 洋
国立がんセンター研究所がん情報研究部がん診療支援情報研究室 , 国立がんセンター中央病院薬剤部 , 札幌医科大学医学部附属病院薬剤部 , 東京大学医学部附属病院将来計画推進室

Package insert written by SGML

Nozomi Nakahashi , Shin'ichiro Saitoh , Michihiro Shino , Hiroko Matsumoto , Kazuyoku Saijo , Takao Orii , Hiroshi Mizushima

Cancer Information and Epidemiology Division, National Cancer Center Research Institute(nnakahas@ncc.go.jp) , Department of Pharmacy, National Cancer Center Hospital , Department of Pharmacy, Sapporo Medical University Hospital , Project team for the hospital development, University of Tokyo


Abstract: What is required in drug information is to communicate them as soon as possible and as accurate as possible. It is also important to utilize these information to various formats or media. On the other hand, there is necessity to reduce the works to maintenance their data for the provider of drug information. We tried to solve such paradoxical problems by using Standard Generalized Markup Language(SGML). SGML is the method to allow the information in documents to be shared, and needs Document Type Definition(DTD). We defined the DTD based on the analysis of the package inserts, and transformed the the documents of the package insert to SGML text with our DTD

Keywords: SGML, package insert



1. はじめに

医薬品情報を効率的に活用するため、標準汎用マークアップ言語(Standard Generalized Markup Language、以下SGML)により文書を記述しデータの汎用性、再利用性を検討した。
SGMLは文書を電子的に保持する手法として、国際標準化機構(ISO)により1986年にISO 8879として、日本工業規格(JIS)により1992年にJIS X 4151としてそれぞれ規格化されている。現在、文書データを保持するフォーマットとしてHTML、Postscript、TeX、PDF、RTF、テキスト等が存在するが、SGMLは本質的にはこれらの如何なる手法とも異なるものである。その理由は、SGMLは体裁ではなく論理的構造に根ざしたデータ構造をとるためである。これにより、体裁は外部の処理系により論理的構造に応じた体裁情報を付加してやることが可能である。
本研究では、医薬品情報の一つである医薬品添付文書(以下添付文書と表記)についてSGMLにより文書をデータ化し、データの可搬性、汎用性、再利用性を検討するため単一データから異なった複数の体裁を有する媒体への自動出力を試みた。

2. 方法

2.1 添付文書の論理構造の解析と文書型定義の作成

構造既存の紙媒体の添付文書の論理的構造についてまず「効能・効果」「使用上の注意」等の項目毎に要素分類し詳細な論理構造の解析を行い、その結果を基にDTDを作成した。
DTDにおいては論理構造の他、外字、単位についても定義した。

2.2 文書インスタンスの作成

次に既存の添付文書のうちの任意の数文書について上記のDTDによりSGMLによる記述を試み、DTDの要素の不足、構造関係の矛盾等の検証をした。記述に際してはテキストエディタを用いた。作成された文書はDTDとの論理的整合性をとるため、フリーソフトウェアであるsgmls 1.1jというSGMLパーサを用いて検証した。

2.3 出力系プロトタイプの実装

SGML化された文書の出力については、紙媒体の添付文書全文の版下及びHTML形式の出力を試みた。版下出力についてはフリーの組版ソフトウェアであるLaTeXを使用した。処理の流れは、SGML文書インスタンスから自作したフィルタで処理を施してLaTeXソースを生成し、更にそれをTeXで処理して版下を生成した。HTML出力はSGML文書インスタンスから直接、自作のフィルタで処理を施しHTML出力を得た。HTMLにおいては文書内の参照関係を保持したままSGMLからHTMLへ変換するよう設計した。生成したHTMLソースは、Netscape 3.0およびInternet Explorer 3.0により閲覧可能であるかどうか、参照(ハイパーリンク)が正しく生成されているか等について確認した。

3. 結果

添付文書の論理的構造は最上位階層の分類においては論理的整合性がとれているが、分類が下位になるほど記述に一貫性がなく、論理構造を解析するのが非常に困難であった。これは、添付文書作成のガイドラインが論理的構造を意識したものではなかったこと、記述すべき内容が薬剤の種類により多様であるために論理構造の体系化が困難であったことなどが理由として考えられた。
また添付文書は表を多用しているがSGMLとの親和性は低く、DTD version 1.0では表の記述に関してのみはやむなく体裁情報を保持しなければならないという結果となった。外字に関しては、対応している処理系では正しく漢字として認識され、対応していない処理系では平仮名で認識されることが確認され、出力は処理系によって異なれどもデータは単一であるというSGMLの長所を最大限に生かす結果を得た。
版下出力に関してはTeX自体が非常に高機能であるため、比較的簡単なフィルタの記述だけで、実際の添付文書に匹敵する程の高品位の出力が得られた。 SGMLからLaTeX、HTMLソースへの変換は比較的スムーズであった。 SGML、HTMLの両者においては内部・外部参照が可能であるので、SGMLでの参照関係を保存したままHTMLに結果を反映させていくことが可能であると証明できた。添付文書のように、文書をそのまま閲覧するだけではなく検索、抜粋、変換をすることにより有効活用が期待できるような情報については、SGMLは非常に優れた手段であることが本研究により証明された。

4. 考察

DTD作成においては既存の添付文書を参考にして行ったが、既存の添付文書は論理的不整合も多く、内容的な散逸などが見られることもあり、そのまま電子化することが決して好ましくないと考えられた。これは、今までは紙媒体を対象とした文書の設計であったため、紙に対しての出力体裁に偏向するあまり、版面設計から文書構造が規定されていったためと思われる。
SGMLによる文書インスタンスはそのままデータベースとしての性格を有するものであり、今後はデータベースとしての文書インスタンスの運用方法を検討する必要があると思われる。
今回は添付文書についてのみ着目し、DTD作成、文書インスタンス作成、出力試験を行ったが、現実には添付文書のみを参照することにより必要とする情報が得られることは少なく、インタビューフォーム、配合変化情報、相互作用情報、文献などの様々な情報を総合して目的とする情報を獲得することが殆んどである。従って、これから医薬品情報全般にわたってSGML化し、効率的な情報の運用を目指すことが重要と考えられる。


図表

図1、処理の流れ


参考文献

1 国立がんセンター薬剤部:医薬品添付文書文書型定義第1版、1996.
2 中橋望:これからの医薬品情報の在り方:あいみっく, 18:22-24, 1997.
3 斉藤真一郎他:ネットワーク化時代における添付文書情報のあり方:臨床と薬物治療, 16:356-361, 1997



Microsoft Access TO HTML Converter.Medical Informatics,Shimane medical UNIV.