The Internet を利用した学会データ収集 システムの開発

辰巳治之 (tatsumi@sapmed.ac.jp) 日本解剖学会データベース委員 札幌医科大学医学部解剖学第一講座

Acta Anat Nippon (解剖学雑誌) 68:564-579 (1993)

第98回全国学術集会(北海道大学:93年7月22-24日)では、従来の、学会抄録原稿 に加え、学会発表データシートと、さらに学会発表データシートの電子化データ の提出をデータベース委員会からお願いした。次回から学会員の作業量が軽減さ れるように、抄録原稿と学会発表データシートとをまとめることが検討されてい る。電子メールによる投稿が可能になれば、抄録提出やデータベース化が簡単に なり、いろいろな副産物や将来性もあり期待されているが、そのようなシステム は今までなかった。そこで、電子メールにより、学会誌に掲載する原稿の収集と データベース作成の一体化ができるようにthe Internetを利用した学会データ収 集システムを開発した。今回、このシステムを、第98回全国学術集会にて実験お よびデモすることができたので、ここにその概要を説明し、問題点を考察する。

各データについて

学会抄録原稿(図1a)

学会抄録原稿は、図1に示すようにを現在では殆んどの場合、コンピュータ入力 したものを印刷しており、手書きは全くないといってよい。これがデータベース 化されるときに、まったく利用されていないのは、残念である。

学会発表データシート(図1b)

データシートの場合、各データ項目の枠のなかに活字を入れるのはけっこう難し く、手書きする場合が殆んどである。この手書きのものを、学術情報センターに て、人海作戦により手入力し、データの点検、修正に、時間と経費を費やす。こ のようにして作成されたデータベースも、オンライン利用となると、図1のよう に学会員と、コンピュータ・ネットワークおよびデータベースとの接点はなく、 研究者のデータベースを利用したいというニーズはあるものの、このままでは、 盛んにデータベースが利用されるとは思えない。 この様な状況ではあるが、将来の為に、なるべく早期に電子化データを蓄えるこ との大切さは十分理解できる。学会レベルで解剖学者のための、解剖学者自身に よる、解剖学のデータは、日本では殆んど電子化されておらず、早急になんらか の形で、データを電子化し蓄積する必要がある。そこで、学術情報センターの協 力を得て、抄録のデータベース化を第98回全国学術集会(北海道大学)において 試行し、第99回全国学術集会(山形大学)において本格的実施を図ることになっ た1)。

\special{epsfile=fig2.eps hsize=230 vsize=130} 図2 各データ : 電子メール}

電子メール(図2)

前述のように、抄録原稿をつくるのに殆んどの研究者がコンピュータ入力したも のを印刷し作成していることを考え合わせると、そのデータを電子メールで集め ることができれば、再入力によるミスやそれに要する費用、時間も節約できる。 このようなデータ収集の方法だと、研究者とコンピュータ・ネットワークとの接 点ができるために、ネットワークを介した問い合わせやデータベース利用も容易 にでき、学会活動や研究活動が活性化されるであろう。

データ収集システムの特徴

The Internetを使う

インターネットとは元来、各ネットワークを接続するものという意味であるが、 the Internetというと、その中でも、TCP/IP (現在では世界の de facto standard になっている)という通信プロトコールを使って行なわれているネットワークで、 お互いに相互乗り入れが実現されているネットワークの集合体で、世界最大のも のである。すなわち、現在では、学術ネットワークとして最も利用価値が高く、 世界のほとんどのネットワークがつながっているということから、このネットワー クしかないといっても過言ではなかろう。

事実、旧ソ連でクーデターが起きた次の日には、エリツィンからの英語のメッセー ジが(どこで英訳されたかわからないが)フィンランドにわたり、全世界を駆けめ ぐり、私の机の上のworkstationにまで飛び込んできた。いろいろな意味で、情 報の民主化はここまで来ている。さらには、ロシアの国際産婦人科センター長か ら直接、救援をもとめる電子メールがとどいたり、米国大統領および、副大統領 の電子メールアドレスのアナウンスがあり、広く意見を吸い上げるとのことであ る。

The Internetを使って学術情報の交換も世界各国でかなり盛んに行なわれており、 データベースも精力的に構築されている。これらのことを鑑み、文部省学術情報 センターも、研究促進のために、TCP/IPをつかったインターネットバックボーン 形成を開始した。現在では、まだ、全ての大学がインターネットに接続され

\special{epsfile=fig3.eps hsize=330 vsize=400}

図3 電子メールによる投稿

ているというわけではないが、全国共同利用施設である大型計算機センターを中 心として、インターネットのバックボーンであるSINET2)が構築され、各地域の ネットワーク協議会3)等の形成も始まっているので、すべての大学、研究所が接 続されるのは時間の問題である。このような情勢からすると、the Internetをつ かった学会データの情報収集システムは、時宜にかなったものと考えられる。

電子メールによる投稿(図3)

第98回解剖学会総会では、実験的に電子メールでも抄録を受け付けた。その投 稿の仕方に、

a. 直接 the Internetに送る

b-c. 間接的に the Internetに送る

d. floppy diskを学会会場にもってきて、その場でthe Internetに送る

という方法を用意した。今回、幸いなことに、総会担当の北海道大学では学内 LAN(Local Area Network)であるHINESの整備が完了しており、学会会場にもthe Internetの回線が敷設されていた。従って、学会会場で投稿実験およびデモをす るにあたって、新たに工事をする必要もなく、the Internetに容易に接続できた。 将来、このように知的生産活動をする拠点である大学や研究所には、the Internetが当たりまえの環境として存在するであろう4,5)。こうなれば、抄録を 作ったコンピュータから直接投稿することができる。また、the Internetを使っ た方法だと、国内はもちろんのこと、海外にいる研究者もまったく同じように投 稿可能である。

The Internetによる情報のやりとりを原則として、学会データ収集システムの開 発をおこなった。しかし、現在、the Internetの大学への普及率が低いこと(特 に医学系)を鑑み、the Internetからの直接投稿(図3-a)のほか、全国共同利用 施設である大型計算機センターや学術情報センターに接続して行なう方法(図 3-b)や、the Internetに直接接続できない学会員のために、商業ネットワークで あるPC-VANやNIFTY-SERVEなどを使う方法(図3-c)も案内した。 商業ネットワークを介する方法は、WIDE6)の研究の一環として行なわれているパ ソコン通信システムとの相互転送7)、および学術情報センターの電子メール交換 実験8)を利用している。商業ネットを使ったthe Internetとの電子メール交換に あたっての利用方法、および遵守事項については、各ネットの電子掲示版、また は、学術情報センターニュース No24:9頁(1993)を参照されたい。 さらに、the Internetおよび商業ネットに馴染みの薄い学会員には、抄録データ (テキスト・ファイル形式)の入ったdiskを持参してもらい、学会会場で直接 the Internetに接続されたコンピュータから投稿(図3-d)することを経験しても らった。

その他の特徴

今回のシステム開発において、
    投稿作業が簡単であること
    経費がかからないこと
    再利用の可能性、発展性
に重点をおいた。 つぎに、投稿作業について説明する。

投稿作業

抄録を電子メールで送るだけである。そうすると、登録番号が自動的に返送され るシステムになっている(図2)。しかし、日本語を扱うとなると、これが急に複 雑になり、頓挫してしまうことがしばしばである。この壁は、避けて通れない壁 である。そこで、ユーザが勉強をしてこの壁をこえるか、この壁を破ってくれる システムをつくるかである。そこで、両者の歩みよりを考えてみる。

ユーザからの歩みより

The Internetのmailの操作に慣れること。この使い方は、近い将来、大学の 一般教育課程や義務教育で、教えることになるであろう。(一部の大学や学校で はすでに開始している。)

日本語のmailはJISコードに変換してから出すこと。具体的には、kcやnkfと いうソフトでJISに変換してmailを送る。

共通の文字コードしか使わない。外字、半角のカタカナ、各メーカの特殊文 字等を使うと、互換性がなくなる。これは、近い将来解決されるであろうが、現 在のところthe Internetでは互換性のために、使わないようにする。

複雑なように見えるが、あるfileをJISコードに変換して抄録データを送るには、

nkf -j file | mail db-abst@sapmed.ac.jp

とするだけである。

システムからの歩みより

解剖学の研究者は当然のことならが、コンピュータの素人である。そこで、簡単 に使えるシステムを提案し、第98回解剖学会総会でデモした。システムの構成は、 the Internetに接続されたNeXTコンピュータとDrap&Drop、nkf(kc)というソフ トである。これらのソフトはGNU化9)されており、the Internetや商業ネットに 接続すれば無料で入手可能である。実際の投稿手順を、図4に示す。

1. 抄録を作成、或は、抄録のはいったdiskを挿入する

2. fileを選択し、Drag\&Drop Tool(DDT)のiconの上に重ねる

3. DDTのメニューで解剖学会抄録投稿の項目を選択する

4. Execute ボタンをマウスでクリックする

\special{epsfile=fig4.eps hsize=430 vsize=380}

{\small 図4 システムからの歩みより: 電子メールによる投稿手順}

この作業がおわると、数分のちには、登録通知の電子メールが届く(図5)。そ こには登録番号が記載してあり、データ項目に間違があった場合、errorメッセー ジが同時に届くようになっている。訂正するには、訂正した抄録を再度電子メー ルにて送ればよい。最新のものが採用されるようになっている。

結局は、Executeのボタンを押すことによって、fileをJISコードに変換し、 db-abst@sapmed.ac.jp宛に、電子メールをだしているだけである。まだ、実験段 階だが、自動的に LaTeX 10)の形式にこれらのデータを変換し解剖学雑誌印刷用 の版下もできるようになっている(図3)。

ここに示したようなシステムが、各大学、研究所に少なくとも1つあれば、研 究者による電子メール投稿が可能となり、データベース作成も容易で、さらに、 このようにthe Internetに慣れ親しむことができると、研究者にとっても副次的 なメリットが無数にある。

\special{epsfile=fig5.eps hsize=200 vsize=200}

{\small 図5 システムからの歩みより: 電子メールによる登録通知}

収集システム

データ収集システムとして、UNIXのmailと、そのaliasという機能をつかって実 現した。そこでは、perl11)という文字処理プログラムを利用している。mailが 送られてくると、自動的にregistration numberを一つ増やして、受け付けまし たというメッセージをつけて相手のアドレスに返送する。それとともに、 ##Beginと##Endではさまれた領域をデータとして別のファイルに保存する。その 際に、受付番号と、受付時間を追加して記入する。また、 fail-safeのために、 dbというユーザにもmailを送り保存する。

この受付のさいに、key wordのチェックをして、不備があれば、error message をつけて返送する。db-helpにmailが送られてくると、相手のアドレスにhelp fileを送る。db-testにmailが送られてくると、おくられて来たデータをそのま ま送りかえすので、文字化けがあったかどうかを、自分でチェックできる。受付 締切日がすぎると、元データから、各データレコードが空行で区切られたデータ に変換する。次に、後からupdateされた抄録があるので、最新のもののみの演題 番号と登録番号の一覧表を作る。これらのデータから、最新のレコードの集合ファ イルを作成する。このデータをチェックし学術情報センターに提出する。この最 新のレコードファイルから、学会抄録用のformatに合うように、LaTeX 形式に 自動変換し印刷する。これで抄録の版下ができあがる。

チェックするために、さらに、fail-safe用にとってあったmail、即ち大きな一 つのファイルから 、mh(メッセージ・ハンドラ)ソフトにより、各メール毎に (送付してもらった抄録順に)、番号のついたファイルにする。これで、なにか 不都合があったときに、送られてきたオリジナル・データを容易に参照できる。 ##Beginから##Endの領域を切り出すときに、いろいろなチェックと変換作業をし ており、そのプログラムにバグがあったときに、このオリジナル・データから復 活が可能である。今回の実験では、プログラムのバグもあったし、間違ったデー タ形式のmailもあり、オリジナル・データをとっておくことは大切であった。こ のような最終的なチェックはどうしても人間がせざるをえないが、従来の方法に くらべかなり作業が軽減される。

再利用法

具体的な、再利用の方法として学術情報センターに、このデータを提出するので、 そこのシステムで、将来、検索が可能となる。

また、UNIXのコマンドを使ってキーワードによる全文検索が可能である。現在の ところ、データ量が少ないのでUNIXのコマンドだけで検索は十分である。データ が大量蓄積したときには、データベース専用ソフトとアップリケーションソフト が必要である。

さらに、the Internetのサービスとして、anonymous ftp(the Internetに接続 されていれば誰でも、無料でファイルをコピーできるというサービス)によるデー タ提供や、WAIS(Wide Area Information Servers)などを使って検索サービスを 提供することも可能である。国立癌センターではすでにgopherというプログラム をつかって、the Internetによる情報提供をしている。近い将来に、解剖学会で も実現できればと思う。

問題点

文字

特殊文字や、記号については、\TeX や \LaTeX のフォーマットを受け付ければ 解決できるが、外字の問題は、解剖学会などで共通の外字ファイルをつくるか、 それらに対応したJIS規格ができないと困難である。多少の問題はあるものの、 電子メールによるデータ収集は簡単である。だだ、ここには目に見えないthe Internetの壁がある。

The Internet

大学や研究所としてdomain nameを取得してからthe Internetに接続する必要が ある。そのためには、大学の上層部の理解、お金、技術力が必要である。これら の困難があるにもかかわらず、ここ数年急激に接続サイトが増加している。これ は the Internetのメリットが理解されてきたことの現れであろう。さて、the Internetに接続するには、

1. 専用回線と接続機器

2. UNIX workstation

が必要である。さらに、JPNIC(Japan Network Information Center)から、 domain name とIP addressを取得しないとthe Internetには接続できない。

The Internetに接続するためには、the Internetに接続しているところに接続さ せてもらう。物理的にはpoint to pointの接続であるが、論理的には、世界中の どのmachineやnetworkとも対等に接続される。しかし、相手のネットワークの運 営ポリシーによって通信の自由度が異なる。

文部省管轄の所だと、学術情報センターのSINETに接続するのがよいと思われる。 ただし、各大学や、研究所の諸事情により、地域ネットワークや、WIDE、TISNな どに接続するのもよいし、IIJ(Internet Initiative Japan)12)というIP接続 のサービス会社を利用するのもよいであろう。

さらに、the Internet (TCP/IP ネットワーク13)に接続されたあと、少なくとも 電子メール・システムがinstallされていることが必要で、

1. Domain Name Serviceのためのnamed14)というプログラムと、resolv.confが install されていること

2. sendmailが 設定されていること

3. ソフトが BIND 14)対応になっていること

などが望ましい。IP接続され、mailのやりとりができれば、親切なthe Internet の仲間がたくさんいるので、助言や援助が容易に得られる。

将来

抄録だけでは、学会データベースの価値は少ない。解剖学の基本的なデータや、 視覚情報のデータベース化など、いわゆる、マルチ・メディアのデータベース構 築ができれば、その利用価値は非常に高い。この予備実験は、札幌医大でハイパー・ マルチメディア実験システムとして動きだし、少ないながら成果はあがっている 15)。しかし、これからさらなる発展ということになると、一人では困難で、学 会レベルでのサポートや、the Internetを利用した全世界的な学際的共同開発・ 研究が必要になってくる。

謝辞

今回の実験に関して深い理解を示して頂いた、解剖学会の方々、そして、北海道 地域ネットワーク協議会3)、北海道大学大型計算機センター、北海道大学、札幌 医科大学、学術情報センター、WIDE、JAIN16)の皆様に感謝いたします。また、 キャノン株式会社・映像コミュニケーション企画センター亀井忠重所長の協力を うけ、期待通りの成果を上げ得たことについて、ここに深く感謝申し上げます。

文献

1) 会議録:解剖学会誌 68:344-348\ (1993)

2) 平成5年度 学術情報センター 要覧

3) 北田義孝、辰巳治之: 北海道地域ネットワーク協議会(NORTH)について. WINC Network Symposium 抄録 pp1-6\ (1993)

4) 辰巳治之: 医学の分野におけるコンピュー タ利用の方向と期待:快適な研究環境をめざ して. 医学のあゆみ 152:107\ (1990)

5) Tatsumi H : "Comfortable Research Environment":Academy Equipment from Personal Computing to Interpersonal Communication via Computer Network. Proceedings of the 6th Sapporo International Computer Graphics Symposium pp 12-14\ (1992)

6) 辰巳治之:研究活動とコンピュータ・ネットワーク.

解剖学会誌 68:231-234\ (1993) 7) JCRN Newsletter 2\ (1992)

8) 学術情報センターニュース 24:9\ (1993)

9) Richard Stallman(竹内郁雄、天海良治監訳): GNU マニフェスト. bit 別冊 GNU Emacs マニュアル pp205-213(共立出版)

10) Donald E. Knuth (斉藤信男 監修) \TeX ブック. (アスキー出版), Laslie Lamport (Edgar Cooke・倉沢良一 監訳) \LaTeX . (アスキー出版)

11) Larry Wall, Randal L Schwartz: Programing perl. O'Reilly \& Associates Inc.

12) 浅羽登志也:誰もが参加できるインターネットへむけて - 商用インターネット登場. UNIX USER 2(7):41-46\ (1993)

13) Craig Hunt: TCP/IP Netowrk Administration. O'Reilly \& Associates Inc.

14) Paul Albitz, Cricket Liu: DNS and BIND. O'Reilly \& Associates Inc.

15) 高橋杏三、 辰巳治之、 佐藤松治: ハイパーマルチメディア情報ネットワークを利用した組織学教育シス テムの開発と統合化画像データベース作製実験. 平成四年度札幌医科大学学術振興会医学教育研究助成報告書pp7-13

16) 野口正一 編(平成3・4年度科研費総合研究A 研究成果報告書):「高度学術ネットワークの構築と 高度応用技術の研究」pp1-62\ (1993)

______________________________________________

tatsumi@anat.sapmed.ac.jp

Department of Anatomy, Sapporo Medical University Schoool of Medicine