Microsoft Excelは、科学文献の遺伝子名の誤りを非難した
2分。 読んだ
上で公開
MSPoweruser の編集チームの維持にどのように貢献できるかについては、開示ページをお読みください。 続きを読む
Microsoft Excelは、世界で最も人気のあるスプレッドシートソフトウェアであり、その使用法は業界全体に及びます。 に公開された新しい調査研究 ゲノム生物学 Excelのオートコレクトの問題がゲノミクスジャーナルの論文の約XNUMX分のXNUMXに影響を与えていると主張しています。 デフォルト設定で使用すると、Excelは遺伝子名を日付と浮動小数点数に変換します。
たとえば、次のような遺伝子記号 2月XNUMX日 (セプチン2)と MARCH1 [膜結合リングフィンガー(C3HC4)1、E3ユビキチンプロテインリガーゼ]は、デフォルトでそれぞれ「2-Sep」および「1-Mar」に変換されます。 さらに、理研識別子は自動的に浮動小数点数に変換されるように記述されていました(つまり、アクセッション「2310009E13」から「2.31E + 13」)。
実際、これは新たに発見された問題ではありません。 Excelが誤って遺伝子記号を日付と浮動小数点数に変換する問題は2004年に最初に説明されました。ほとんどの一般的なユーザーは、ExcelがSEP2を2月35,175日に自動修正することを期待するため、Microsoftはその動作を変更しないことを決定しました。 しかし、これらのファイルは頻繁に再利用されるゲノミクスコミュニティの重要なリソースであるため、遺伝子シンボルの変換には問題があります。 この研究では、7467の補足Excelファイルをスクリーニングし、3597の公開された論文に添付された987の遺伝子リストを見つけました。 彼らは、704の公開された記事からのXNUMXの補足ファイルで遺伝子名の誤りを確認しました。
Excelで日付の自動フォーマットを完全に無効にする直接的な方法はないようです。この問題は、LibreOfficeCalcやApacheOpenOfficeCalcなどの他の一般的なスプレッドシートプログラムでも発生します。 この調査研究は、ゲノミクス学界の間でこの問題の認識を高めるために実施されました。
完全なレポートを読む こちら.
ユーザーフォーラム
24メッセージ