「Excelが日付に変換してしまうから」一部遺伝子の名称を変更。ヒトゲノム解析の科学者ら

Excelあるある

Munenori Taniguchi
Munenori Taniguchi, @mu_taniguchi
2020年08月7日, 午後 01:30 in genes
0シェア
FacebookTwitter
KTSDESIGN/SCIENCE PHOTO LIBRARY via Getty Images
KTSDESIGN/SCIENCE PHOTO LIBRARY via Getty Images

人のゲノムには無数の遺伝子が含まれており、DNAとRNAの微妙な組み合わせがひとりひとりにユニークな特徴を与えています。ゲノム解析の研究者らは、これら遺伝子のひとつひとつに記号と英数字を組み合わせたコードで名前をつけ、分別して研究に役立てています。

ところが、ここ最近の解析で付与された遺伝子の"名前"は、非常に扱いにくいことで問題となりました。なぜなら、マイクロソフトの表計算ソフトExcelが、これら遺伝子の名前を入力したセルを勝手に日付だと勘違いするから。

Excelの自動書式設定機能は、日付を簡単に入力できるようにデフォルト設定されており、たとえば”12/1”と入力すれば12割る1ではなく、12月1日に変換します。国際ヒトゲノム解析機構(HUGO)のなかのゲノム命名法委員会(HGNC)の人たちが困ってしまったのは、遺伝子に付けられた名前”Membrane Associated Ring-CH-Type Finger 1”の略称” MARCH1 ”をExcelに入力すると、勝手に”3月1日”に変換されてしまう現象でした。

厄介なことに、マイクロソフトはこの自動変換をオフにする設定項目を用意していません。

同様の変換によって日付になってしまう遺伝子は多数あり、2016年に発表された遺伝学関連論文の約1/5にExcelの自動変換機能が影響を与えていたとされます。そしてHGNCではこのようなエラーの発生を防止するため、過去1年間で合計27個の遺伝子の名前を変えてきたとのこと。例を挙げるなら、” MARCH1 ”という記号を” MARCHF1 ”に、” SEPT1 ”を” SEPTIN1 ”に、といった具合。しかし、まだ自動変換にひっかかるすべての名前を変更し終わったわけではありません。

これまでにも一度つけられた遺伝子の名前が変更された例はあるものの、それらは検索時に誤検出を起こしたり、その名称が特定の人々に懸念を抱かせるようなものだったりしたため。今回のようにたまたま使っているアプリケーションソフトの標準機能のせいで名称を変えるという例は少なくともいままではありませんでした。

科学者であれど当たり前に使用するExcelですが、アプリケーションとしてはより一般的な用途に向けて設計されていることから、マイクロソフトが今回のような特定の分野の問題のためにパッチなどを用意することはなさそうな雰囲気。HGNCのコーディネーターであるElspeth Bruford氏もこの問題は「非常に限られた使用例」であり、書式の自動変換を無効化するオプションはごく一部の人たちの助けにしかならないと述べました。

ところで、Excelはセル内容の自動変換をオフにする設定項目は用意していませんが、入力する文字列の最初にシングルクォーテーションを入れれば、以降の値を文字列として処理するルールがあります。たとえば” MARCH1 ”なら、” MARCH1 ”と入力すれば、それは問題なく文字列として扱われるはずなのですが…?おそらくは、それでも解決できない特殊な不具合があったのでしょう。きっとそうに違いありません。

source:Guidelines for human gene nomenclature(Nature)
via:The Verge

 
新型コロナウイルス 関連アップデート[TechCrunch]

 

関連キーワード: genes, DNA, Genetics, science, EXCEL, RNA, Spreadsheet, Microsoft, spreadsheets, news, gear
0シェア
FacebookTwitter

Sponsored Contents