「肺がん発生率は、たばこを吸う人が吸わない人の何倍 とかって聞いたことありますよね。ああいうのを調査したデータから分析するのが 医療統計学 です」
ごあいさつ直後「医療統計学とは?」と尋ねたところ、返ってきたのがこの答えだった。その名のとおり、医療に関する情報をまとめて統計をとる学門。そして、今回お話をうかがったMIFESユーザー・村上義孝さんのご専門である。
医療統計には、対象者さんの協力が不可欠です。調査を始めるときにはインフォームド・コンセント、きちんと説明して同意をいただきます。
「××脂肪酸をとると循環器死亡が減るとか、果物を食べている人は食べていない人に比べてどうこうとか。新聞にも載ってるし、テレビでも「ためして××」とか「きょうの×康」って番組でもよくやってますよね。「疫学」ともいわれますが、ああいう医学研究も医療統計が活躍する分野のひとつです。さっきの例は、大学や研究所が10万人を対象に10年くらいかけて行った調査の結果なんです」
大学や研究所が行う健康のための調査は、住民健康診断のときに調査票を配って書いてもらうのが一般的なのだそう。このレポートをご覧の方の中にも調査票に記入した経験のある方がいるのではないだろうか。
「たばこの調査のようなものは”追跡調査”になります。毎年、お元気か、同じ住所にお住まいかなど、1件1件電話で確認します。」
そのなかで、残念ながら病気を発症された方に関しては、診ていただいている病院を教えてもらい、その病院に出向いてカルテからコアな医学情報を得るそうだ。
街角で実施されるアンケート調査や経済のパネル調査なども大きな分類上は統計学だが、医療統計学や疫学は、「いろんな手法で、いろんな場面で、長い期間続けてデータを集めるという点が大きく違う」のだそうだ。
病気などの調査の他に「医療統計学」がかかわることが多いのは、新薬が出たときに行う「臨床試験」。その有効性や安全性、副作用がないか、そしてその病気に効くのかをなどの調査を人間でしないといけないのだそうだ。
「その場合も、対象になる疾患を抱えた患者さんに同意いただいたうえで投与し、問診票で状況を聞いたり、カルテ情報を調べたりします」
今、村上さんが進めている手法は、同じようなプロジェクトで情報を持ち寄り、大きな情報を得るというやり方だそうだ。
「まったく同じではないけれど、世界中に同種の研究がたくさんあるんです。それぞれが1,000人分のデータでも、10個集まれば10,000人分、100個集まれば100,000人分の大きなデータベースになるわけです」
まとめたデータを分析・解析するためにご利用なのが、SAS(サス)という統計分析システム。CSV形式のデータを取り込むことができ、解析結果をテキストデータで出力するというもので、SASで解析した結果は統計学の分野で認知されていて、村上さんは学生時代から使っているという。
そして、村上さん曰く「それこそ、まさにMIFESなんです」
つまり、個々のデータは表計算ソフトでも開けるが、まとめた大きなファイルは限界があって開かなくなる。実際は大きなファイルもSASに取り込めるのだが、その前に整形しながら目を通しておきたいのだそうだ。
さらに、解析結果をまとめるために、SASから出てきたデータの見た目や形式を修正するのだが、「実は修正しながら解釈は始めているんです。だから僕の場合はデータをいじる作業は大事なんです」
SASに取り込む巨大なデータと、SASから出力される分析結果は、いずれもテキストデータ。それらを開き編集するために、MIFESを使っていただいているということだ。
「医学分野の人間が集まると、いろんなソフトの話題になります。統計ソフトやテキストエディタはなに使ってる?とか」
今、探しているのは”かっこいい”グラフが描けるソフトだそうだ。
SASからの結果データの一部。主に表の部分をコピーしてMIFESへ持っていき、CSV形式に変換して、データを整える。
(参考:FAQ「SASの結果データをCSV形式に変換する方法」)
ところで大学の先生と言えば思い浮かぶのは、「論文」。「論文」→「卒論」と直結してしまう私は、何度も書き直した嫌なイメージがあるのだが。
「同じですよ。何人かに見ていただいて、赤を入れてもらいます。だから、やっぱり何度かは書き直しますね。」
その書き直した原稿はどのように管理されているのだろう?
「全角を半角に置き換えたりするのも、表計算ソフトだと何十秒かかかることが、数秒でできる。だからテキストエディタがいいんです。」
「今は、ファイルのバックアップを残したり、ファイルによってはEXCELのシートでバージョン管理していますね。あ、マニュアルに載ってましたね、バージョン管理との連携のこと」
私たちがうかがうというので、前日にMIFES 9のマニュアルを見ていただいたそうだ。
ただ、バージョン管理システムは知っているが、使いこなせるか、信頼できるのかがまだ少し不安で、気になってはいるもののこれまでは使ったことがないとのこと。個人のパソコン内のファイル管理にも便利なので、メガソフトサイトの「バージョン管理システム」を参考に、この機会にぜひ試していただきたい。
論文は、ジャーナルに投稿し、審査を受けて通るとそのジャーナルに掲載され、それが「発表」なのだそう。
その「ジャーナル」を見せていただくと、すべての論文が英語で書かれていた(やっぱり)。そして1つの論文には、表は2、3個、グラフは3、4個ついている感じだ。
「投稿する原稿自体はもちろんテキストデータですが、表もテキストで書いて本文に埋め込むように指示される場合が多いですね。だからぼくは、表はテキスト情報だと思っています」
なるほど、テキストデータは万国共通。論文は世界中から寄せられるのでアプリケーションによる「方言」をなくすためにもテキストデータで、ということなのだろう。
これからもコツコツとした作業は続きます。
統計情報はテキスト情報が基本で、いろいろなソフトの中をとおって加工はされますが、最後はやっぱりテキスト情報に戻ってきます。若い人たちに限らず、文章を書いたり、文章をじっくり読んだりする作業が減り、その大切さが忘れられているのがとても残念です。
最後にそんなことをおっしゃっていたのが印象的だった。(聞き手:メガソフト・Z)
台風15号が近畿に最接近した9月21日。警報がでて大学はお休みなのに「出勤」されるという情報。「医療」「統計」というキーワードとあいまって、とっても生真面目な方では…と身構えていたのですが、とてもにこやかに出迎えてくださいました。「写真を撮らせてください」とお願いしたら、鏡に向かってヘアスタイルを整える場面も。
「医療統計学」という名前はなじみのないものでしたが、その内容は日常的に目にしているもので、なるほど確かにデータを集めて解析している方がいての情報だったのだと、同行した営業担当と改めて感心した次第です。
さて、MIFES 9の新機能「CSVモード」。セルを結合したりセルを分割したりが簡単操作で行えます。
表計算ソフトで結合すると、右側のセルの内容は消えてしまいますが、MIFESのセル結合なら内容も合体します。