EXCEL の機能を知らない研究者が遺伝子の名前を変更することを発表してしまう
Excelのありがた迷惑な機能で人間の遺伝子名が変更される
というニュースが話題になっている。
これらの“自動変換”は、そのセルに入力した時点で「書式」が「日付」であるとExcelに認識され、それに則って表示されるだけなので、オートコンプリートやオートコレクトをオフにしただけでは切ることができない。加えて、入力したあとに書式を「文字列」に設定しても数字となるので厄介だ。回避するには、あらかじめそのセルの書式を文字列として指定しておくしかない。 |
と書かれているのだが、テキストなどから変換したときに誤変換されるのが主な原因らしい
Excelによる遺伝子名の誤変換 -傾向と対策-
つまり、テキストからの変換時に、ちゃんとデータインポートツールを使用しないで、直接開いてるんじゃないかという線が濃厚になる。
CSV ファイルをオリジナルのまま取り込む方法
ちなみに、テキストをそのままエクセルに取り込む方法は20年前からある機能なのである。
研究者が知らないのは仕方ないとしても、この記事を書いている株式会社インプレス の記者が知らないのはどうなのだろうと思う。
研究者であるなら、このくらい調べればいいと思うのだが…。
なぜ、そこまで無能なツールだと思ったのか(((・ω・)))?
エクセルで巨大なファイルを作っちゃう人の一人なんですけど、最初っから全ブックのセルを文字列にしてしまう方法って無いんでしょうか?
研究者というか、DNA解析機材からのデータを整形するのはテンポラリーなバイトや学生なので、Excelの細かい使い方を指導する対象じゃないってことが先ずあります。
次に、セルデータの変換はロケール依存です。DNA研究は国際協力で進むことが普通で、送ったExcelファイルが他国で異なって表示されたり、他国内での加工で変わることもあります。
そして、ヒト遺伝子の略称4.4万の名称は、研究者ですら全部覚えられないので、国をまたいでExcel加工のどの時点で誤ったかどうかなど、予防したりチェックしきれません。その結果、20%もの論文に誤りが掲載されるに至っていたわけです。
ある意味、研究・開発体制の実態に沿った、現実的な解決策とも言えます。