联系我们contact

电话:027-59760188-801

地址:武汉市东湖高新开发区光谷大道120号现代森林小镇A座609室

电子实验记录系统实施——之业务分析篇

发布时间:2018-05-24 浏览次数:357次

1  介绍

电子实验记录在国外如火如荼,在国内方兴未艾。作为一款兼具管理型和工具型特点的软件在其实施方式和实施策略上尤其独特之处。完全采取管理型软件的思维去做ELN肯定是行不通的。想要做好ELN的实施,必须充分地理解实验室研究人员的研究工作,而不是仅仅去调研大面上的东西,诸如试剂信息,人员信息,几个表格之类的。可以说,你对用户工作理解的程度决定了ELN中实验模板设计的高度。要做到这一点,首先要分析你的目标用户(即生物,工艺,合成,分析等等)具体是怎样开展日常研究活动。理解这些过程将对ELN的开发、配置、部署产生重要影响,也是一个ELN项目成功的必要条件。

ELN最终的实施成果体现在实验模板的设计上,实验模板的设计又决定于两个因素,一个是实验过程所涉及到的数据,还一个是实验室内部的协作方式。

2  实验记录数据结构分析

实验操作和记录是一个物流和信息流并行的过程。从物流的角度讲,实验时所用到各种试剂,原材料都属于输入性的流入,而产生的样品则是输出。从输入到输出的转换过程则是由实验人员的实验操作和仪器设备协同作用所引起的。从信息流的角度讲,项目的背景信息、原材料的各种属性、仪器设备的各种运行条件、实验操作的各种参数都是输入,输出的则是样品的各种性能或结论性数据,这中间涉及各种数据转换、分析、计算的处理过程。从实验开始到实验结束就是一个数据不断产生的过程。

从ELN实施的角度来讲,我们需要将ELN能提供的数据容器与目标用户所产生的数据匹配起来。我们需要把实验过程中产生的数据分成两类,一类是输入型的数据,一类是输出型的数据。对于输入型的数据必须仔细分析实验的全过程,将数据源都找出来,常见的输入数据源有仪器数据(包括仪器基本信息和测试数据)、实验过程观测数据、外部文献数据、项目背景信息、原材料信息、以及他人提供的数据。这里特别需要注意的是实验过程产生的样品相关数据,从物流的角度讲,样品属于输出型流出,但从信息的角度讲,样品的分析测试数据属于实验的输入数据。以上各种输入型数据经过数据抽取(Extract)、清洗(Cleaning)、转换(Transform)、装载(Load)后进入各种统计计算工具处理得出结果。从ELN满足数据记录完整性的目的来讲,ELN必须能够存放或关联所有的输入型数据和输出型数据(结论),包括中间处理过程。ELN模板的设计者要也要考虑输入和输出的数据分别放在ELN的哪些模块中,以及这些模块之间的关联关系。我们经常看到一些单位的实验记录本只记载了如何做的实验,对于实验的结果与结论丝毫没有提及,这样的实验记录其实是没有任何意义的。

搞清楚数据来源和输出之后,我们需要进一步分析这些数据源的格式和使用方式。数据的格式和使用方式是分不开的。很多数据源,特别是仪器一般会提供多种数据格式的文件,这时就需要我们结合数据的使用方式去决定其使用格式了。例如对于红外光谱,可以输出图片型的光谱图,也可以输出光谱的散点数据,如果仅仅是判断物质结构用图片就够了,但如果需要与其他光谱进行比较,那么散点数据就是必须的了。在ELN中,我们需要根据数据的使用格式选择合适的模块存放数据。如果数据要参与计算的,那么就尽量结构化。在数据使用方式上,我们除了考虑单个实验中的数据使用,也要考虑全局性的数据利用,例如对项目全局,或实验之间进行数据的抽取和比较,也会进一步限定数据的记录格式。特别是针对结果或结论型的数据,由于其已经是一个实验最终结果了,在单个实验记录中以任何形式存放都是合适的,但如果这些数据将来要参与跨实验或跨项目的利用,在存放形式就需要专门考虑。

在数据的利用形式上,还要考虑到查询。电子记录的优点在于数据查询和挖掘,并从多个实验相结合的角度将数据转化为信息的能力。这方面的分析将决定数据的存储方式和将来数据的可利用程度。

以上是从静态的角度讲针对每一个不同的用户群体,不同的研究领域,需要根据其数据的特点设计满足需要的记录方式。当然这也是在实验模板设计中主要考虑的方面,但实验室中协作是避免不了的。除非你完全忽视其存在,否则这种协作关系最终也会影响到实验模板的设计形态。

3  实验记录工作流分析

仅仅在ELN中实现实验记录的功能在现在这个时代背景下是不能充分满足用户需求的。这个需求既是管理上的,也是技术上的。ELN项目实施的成功想要获得管理人员的认可,仅仅去展示如何去做实验记录是远远不够的。说到底,实验记录太接地气了。从技术上讲,日常人员之间协作产生的数据交换本身也是在ELN中建立这种流程体系的内在需求。

电子实验记录的工作流分成两种,一种是实验记录的审签流程,一种是实验人员之间的协作流程。

对于第一种工作流来说,属于钢性需求。不管对于任何行业,纸质记录的见证人签字都是必须的,这一点如果马虎对待,发生专利纠纷时就有苦头吃了。纸质记录迁移到电子记录同样要遵循见证人签字的流程。如果你去调研实验人员,他们对这个需求不会太敏感,甚至不会太在乎。如果去调研法务部门或者知识产权部门,回答就会截然不同。除了见证人签字,有些单位还要求进行审核,包括实验方案的审核和实验结果的审核,这种情况下就要在一般的两级见证人签字的工作流中增加节点。

对于第二种工作流,主要是指人员与人员之间在数据上的协作。不同的领域,不同部门之间的协作方式往往不一样。与前述的文档审批工作流不一样的是这种数据协作的工作流还往往会影响到实验模板的设计。下面分别说明。

在一个实验由多个人协作完成的情境中,在创建实验后,主要负责人和实验的参与人都需要在实验中补充数据。实验记录在实验人员之间逐次传递,数据补充完整的实验记录最后回到实验创建者手中。举个例子说明一下,一些工艺学研究就属于这种类型。不管是化学工艺还是生物工艺,往往执行轮班作业。采用纸质记录时往往在记录工艺参数之后要写上记录人,而电子记录则会从登陆系统的人的身份上去判断。

很多实验室都会有一些资源上的共享,例如分析配制的母液,缓冲液,中间体、载体、细胞系等等,这些资源大家都可以用,但这些资源创建的过程是实验室中某一些人做的,只有他们那里才有详细的记录。当我们需要使用这些资源时就需要引用其创建过程,以表明物品和数据的源头。体现在ELN中就需要根据这些资源的编号能快速获取其制备过程的记录,或者将这些记录链接到使用者的实验记录上。

这里还要说到的一种是样品的传递,既包括实物的传递也包括信息的传递。这些样品的去向主要有两个,一个是传统的分析实验室,一个是活性评价实验室(或者叫性能评价实验室)。对于分析实验室已经配备了LIMS系统的用户来说,需要的只是ELN与LIMS之间做好整合:以前在LIMS中提交样品转移到ELN中提交样品,分析结果也直接返回到eLN中来。对于没有任何信息系统的用户来说,此时很可能会提出要求在ELN中实现样品提交和结果返回的功能。对于提交到活性评价实验室的样品,即便上了LIMS的用户也很少将这种合作关采用LIMS去实现,此时就需要用户权衡放在哪个系统中了。

4  对需求进行分级

搜集到的需求一般有三类:

       •    必须有

       •    期望有

       •    最好有

搜集到这些需求之后,首先要与软件本身所有的功能做差异分析。把那些软件现有功能满足不了的需求单独列出来,再按照上面的三个层次进行分级。这里重点是第一个层次,也就是刚需“必须有”。满足这个条件的需求必须符合两个关键标准,第一是软件本身无法通过配置实现,二是该项功能能显著提高用户的工作效率,或者对数据完整性十分必要。满足这两个条件,就必须通过二次开发实现了,好在现在很多ELN都提供二次扩展的功能。把必须实现的功能开发完成,ELN就可以开始部署了。”期望有”和“最好有“的需求在用户实际体验之后再逐步实现,有些甚至可能都不需要实现了,因为用户在软件使用后想法也会发生改变。用户在不了解软件的时候提的一些想法可能并没有实际意义,停留在纸面上,看起来比较美好而已。

在功能实现方面,在国外早期做ELN实施时有一个提法叫“Paper on Glass”,,意思是仅仅是把原来纸质的换成了玻璃屏幕的,换句话说就是把用笔写仅仅换成键盘输入。这样做的目的就是尽量不改变现有的记录习惯,让用户更快地上手用起来,然后在用的过程中逐步把相关的功能加进来。当然这是很早期的做法,现在的ELN,即便功能最简单的也会或多或少要用户做些改变,例如说原来直接写的变成让用户下拉选择的,原来要自己用计算器算一下的变成了自动计算的,这些小的方面的变化不仅没有使用户感到太突兀,反而带来了很多便利,大家乐于接受,从数据管理的角度来说规范了数据录入,避免了错误,改善了检索的效度。仅仅把手写输入改为键盘录入,远远不是ELN 的最终目的,如今的产品经过十多年的发展早已具备适应各个领域的特色化功能,包括化学反应的录入和计量学计算,溶液配制、计算与统计等诸多功能。

总之,实施的策略就是逐步添加功能,先加上比较简单的,易于使用的,后续再采用锦上添花的方式不断加入。这是一个不断进化的过程,即便再先进智能化的东西一步到位会让很多的实验人员一时茫然无措,反而会起到反作用。