Microsoft Excel 被指责为科学文献中的基因名称错误

阅读时间图标 2分钟读


读者帮助支持 MSpoweruser。如果您通过我们的链接购买,我们可能会获得佣金。 工具提示图标

阅读我们的披露页面,了解如何帮助 MSPoweruser 维持编辑团队 查看更多

Excel

Microsoft Excel 是世界上最流行的电子表格软件,其使用范围跨越多个行业。 一项新的研究发表于 基因组生物学 声称 Excel 自动更正问题影响了大约五分之一的基因组学期刊论文。 使用默认设置时,Excel 会将基因名称转换为日期和浮点数。

例如,基因符号如 2月XNUMX日 (Septin 2) 和 MARCH1 [Membrane-Associated Ring Finger (C3HC4) 1, E3 Ubiquitin Protein Ligase] 默认分别转换为“2-Sep”和“1-Mar”。 此外,RIKEN 标识符被描述为自动转换为浮点数(即从加入“2310009E13”到“2.31E+13”)。

实际上,这并不是一个新发现的问题。 Excel 无意中将基因符号转换为日期和浮点数的问题最初是在 2004 年描述的。由于大多数普通用户希望 Excel 将 SEP2 自动更正为 2-Sep,Microsoft 决定不改变其行为。 但是基因符号转换是有问题的,因为这些文件是基因组学社区中经常重复使用的重要资源。 这项研究筛选了 35,175 个补充 Excel 文件,找到了 7467 篇已发表论文所附的 3597 个基因列表。 他们确认了来自 987 篇已发表文章的 704 个补充文件中的基因名称错误。

似乎没有直接的方法可以永久禁用 Excel 中日期的自动格式设置,并且此问题也出现在其他流行的电子表格程序中,例如 LibreOffice Calc 或 Apache OpenOffice Calc。 这项研究旨在提高基因组学学术界对该问题的认识。

阅读完整的报告 这里。.

用户论坛

24消息