生物信息学范文10篇

时间:2023-03-21 16:01:04

生物信息学

生物信息学范文篇1

关键词:推荐系统;生物信息学

推荐系统(RecommenderSystem)[1]是个性化信息服务的主要技术之一,它实现的是“信息找人,按需服务”;通过对用户信息需要、兴趣爱好和访问历史等的收集分析,建立用户模型,并将用户模型应用于网上信息的过滤和排序,从而为用户提供感兴趣的资源和信息。生物信息学(Bioinformatics)[2,3]是由生物学、应用数学和计算机科学相互交叉所形成的一门新型学科;其实质是利用信息科学的方法和技术来解决生物学问题。20世纪末生物信息学迅速发展,在信息的数量和质量上都极大地丰富了生物科学的数据资源,而数据资源的急剧膨胀需要寻求一种科学而有力的工具来组织它们,基于生物信息学的二次数据库[4]能比较好地规范生物数据的分类与组织,但是用户无法从大量的生物数据中寻求自己感兴趣的部分(著名的生物信息学网站NCBI(美国国立生物技术信息中心),仅仅是小孢子虫(Microsporidia)的DNA序列就达3399种),因此在生物二次数据库上建立个性化推荐系统,能使用户快速找到自己感兴趣的生物信息。特别是在当前生物信息数据量急剧增长的情况下,生物信息学推荐系统将发挥强大的优势。

1推荐系统的工作流程

应用在不同领域的推荐系统,其体系结构也不完全相同。一般而言,推荐系统的工作流程[5]如图1所示。

(1)信息获取。推荐系统工作的基础是用户信息。用户信息包括用户输入的关键词、项目的有关属性、用户对项目的文本评价或等级评价及用户的行为特征等,所有这些信息均可以作为形成推荐的依据。信息获取有两种类型[6],即显式获取(Explicit)和隐式获取(Implicit),由于用户的很多行为都能暗示用户的喜好,因此隐式获取信息的准确性比显式高一些。

(2)信息处理。信息获取阶段所获得的用户信息,一般根据推荐技术的不同对信息进行相应的处理。用户信息的存储格式中用得最多的是基于数值的矩阵格式,最常用的是用m×n维的用户—项目矩阵R来表示,矩阵中的每个元素Rij=第i个用户对第j个项目的评价,可以当做数值处理,矩阵R被称为用户—项目矩阵。

(3)个性化推荐。根据形成推荐的方法的不同可以分为三种,即基于规则的系统、基于内容过滤的系统和协同过滤系统。基于规则的推荐系统和基于内容过滤的推荐系统均只能为用户推荐过去喜欢的项目和相似的项目,并不能推荐用户潜在感兴趣的项目。而协同过滤系统能推荐出用户近邻所喜欢的项目,通过用户与近邻之间的“交流”,发现用户潜在的兴趣。因此本文所用的算法是基于协同过滤的推荐算法。

(4)推荐结果。显示的任务是把推荐算法生成的推荐显示给用户,完成对用户的推荐。目前最常用的推荐可视化方法是Top-N列表[7],按照从大到小顺序把推荐分值最高的N个事物或者最权威的N条评价以列表的形式显示给用户。

2生物信息学推荐系统的设计

综合各种推荐技术的性能与优缺点,本文构造的生物信息学推荐系统的总体结构如图2所示。

生物信息学推荐系统实现的主要功能是在用户登录生物信息学网站时,所留下的登录信息通过网站传递到推荐算法部分;推荐算法根据该用户的用户名从数据库提取出推荐列表,并返回到网站的用户界面;用户访问的记录返回到数据库,系统定时调用推荐算法,对数据库中用户访问信息的数据进行分析计算,形成推荐列表。

本系统采用基于近邻的协同过滤推荐算法,其结构可以进一步细化为如图3所示。算法分为邻居形成和推荐形成两大部分,两部分可以独立进行。这是该推荐系统有别于其他系统的优势之一。由于信息获取后的用户—项目矩阵维数较大,使得系统的可扩展性降低。本系统采用SVD矩阵降维方法,减少用户—项目矩阵的维数,在计算用户相似度时大大降低了运算的次数,提高了推荐算法的效率。

(1)信息获取。用户对项目的评价是基于用户对某一个项目(为表示简单,以下提及的项目均指网站上的生物物种)的点击次数来衡量的。当一个用户注册并填写好个人情况以后,系统会自动为该用户创建一个“信息矩阵”,该矩阵保存了所有项目的ID号以及相应的用户评价,保存的格式为:S+编号+用户评价,S用于标记项目,每个项目编号及其评价都以“S”相隔开;编号是唯一的,占5位;用户评价是用户点击该项目的次数,规定其范围是0~100,系统设定当增加到100时不再变化。这样做可防止形成矩阵时矩阵评价相差值过大而使推荐结果不准确。(2)信息处理。信息处理是将所有用户的信息矩阵转换为用户—项目矩阵,使用户信息矩阵数值化,假设系统中有M个用户和N个项目,信息处理的目的就是创建一个M×N的矩阵R,R[I][J]代表用户I对项目J的评价。

(3)矩阵处理。协同过滤技术的用户—项目矩阵的数据表述方法所带来的稀疏性严重制约了推荐效果,而且在系统较大的情况下,它既不能精确地产生推荐集,又忽视了数据之间潜在的关系,发现不了用户潜在的兴趣,而且庞大的矩阵增加了计算的复杂度,因此有必要对该矩阵的表述方式做优化,进行矩阵处理。维数简化是一种较好的方法,本文提出的算法应用单值分解(SingularValueDecomposition,SVD)技术[8],对用户—项目矩阵进行维数简化。

(4)相似度计算。得到降维以后的用户矩阵US,就可以寻找每个用户的近邻。近邻的确定是通过两个用户的相似度来度量的。本文采用Pearson相关度因子[9]求相似度。(5)计算用户邻居。该方法有两种[10],即基于中心的邻居(Center-BasedNeighbor)和集合邻居(AggregateNeighbor)。本系统采用了第一种方法,直接找出与用户相似度最高的前N个用户作为邻居,邻居个数N由系统设定,比如规定N=5。

(6)推荐形成。推荐形成的前提是把当前用户的邻居ID号及其与当前用户的相似度保存到数据库中,而在前面的工作中已找出各用户的邻居以及与用户的相似度,推荐形成部分只需要对当前登录用户进行计算。推荐策略是:对当前用户已经访问过的项目不再进行推荐,推荐的范围是用户没有访问的项目,其目的是推荐用户潜在感兴趣的项目;考虑到系统的项目比较多,用户交互项目的数量很大,所以只筛选出推荐度最大的N个项目,形成Top-N推荐集,设定N=5。

3生物信息学推荐系统的实现

生物信息学推荐系统的实现可以用图4来表示。数据库部分主要存储用户信息和项目信息,用SQLServer2000实现。

数据访问层实现了与用户交互必需的存储过程以及触发器,也使用SQLServer2000,主要完成以下功能:初始化新用户信息矩阵;插入新项目时更新所有用户的信息矩阵;用户点击项目时更新该用户对项目的评价;删除项目时更新所有用户的信息矩阵。用户访问层主要涉及网页与用户的交互和调用数据访问层的存储过程,在这里不做详细的介绍。

推荐算法完成整个个性化推荐的任务,用Java实现。

(1)数据连接类DataCon。该类完成与SQLServer2000数据库的连接,在连接之前必须要下载三个与SQLServer连接相关的包,即msutil.jar、msbase.jar和mssqlserver.jar。

(2)数据操作类DataControl。该类负责推荐算法与数据库的数据交换,静态成员Con调用DataCon.getcon()获得数据库连接,然后对数据库进行各种操作。把所有方法编写成静态,便于推荐算法中不创建对象就可以直接调用。

(3)RecmmendSource与CurrentUserNeighbor。这两个类作为FCRecommand类的内部类,RecmmendSource用于保存当前用户的推荐列表,包括推荐项目号和推荐度;CurrentUserNeighbor用于保存邻居信息,包括邻居ID号、相似度及其访问信息。

(4)协同过滤推荐算法FCRecommand。该类实现了整个推荐算法,主要分为邻居形成方法FCArithmetic和推荐形成方法GenerateRecommend。

下面给出方法FCArithmetic的关键代码:

Matrixuser_item=this.User_Item_Arry();//获取用户—项目矩阵

user_item=this.SVD_Calculate(user_item);//调用SVD降维方法

Vectorc_uservector=newVector();//当前用户向量

Vectoro_uservector=newVector();//其他用户向量

Vectorc_user_correlate_vector=newVector();

//当前用户与其他用户之间相似度向量

for(inti=0;ifor(intj=0;jc_uservector.addElement(user_item.get(i,j));

//1.获得当前用户向量

for(intk=0;ko_uservector.clear();

for(intl=0;lo_uservector.addElement(user_item.get(k,l));

//2.获得其他用户的向量

//3.计算当前用户与其他用户的相似度

usercorrelativity=this.Correlativity(c_uservector,o_uservector);

c_user_correlate_vector.addElement(usercorrelativity);

}

//4.根据当前用户与其他用户的相似度,计算其邻居

this.FindUserNeighbor(i,c_user_correlate_vector);

}

根据邻居形成方法FCArithmetic,可以得到每个用户的邻居。作为测试用例,图6显示用户Jack与系统中一部分用户的相似度,可以看出它与自己的相似度必定最高;并且它与用户Sugx访问了相同的项目,它们之间的相似度也为1,具有极高的相似度。

4结束语

在传统推荐系统的基础上,结合当前生物信息学网站的特点,提出一个基于生物信息平台的推荐系统,解决了传统生物信息网站平台信息迷茫的缺点,为用户推荐其感兴趣物种的DNA或蛋白质序列。

优点在于协同过滤的推荐算法能发现用户潜在的兴趣,能促进生物学家之间的交流;推荐算法的邻居形成与推荐形成两部分可以单独运行,减少了系统的开销。进一步的工作是分析生物数据的特点及生物数据之间的关系,增加用户和项目数量,更好地发挥推荐系统的优势。

参考文献:

[1]PAULR,HALRV.Recommendersystems[J].CommunicationsoftheACM,1997,40(3):56-58.

[2]陈新.生物信息学简介[EB/OL].(2001).166.111.68.168/bioinfo/papers/Chen_Xin.pdf.

[3]林毅申,林丕源.基于WebServices的生物信息解决方案[J].计算机应用研究,2005,22(6):157-158,164.[4]邢仲璟,林丕源,林毅申.基于Bioperl的生物二次数据库建立及应用[J].计算机系统应用,2004(11):58-60.

[5]AIRIAS,TAKAHISAA,HIROYAI,etal.Personalizationsystembasedondynamiclearning:InternationalSemanticWebConference[C].Sardinia:[s.n.],2002.

[6]BREESEJS,HECKERMAND,KADIEC.Empericalanalysisofpredictivealgorithmsforcollaborativefiltering:proceedingsoftheFourteenthConferenceonUniversityinArtificialIntelligence[C].Madison:WI,1998:43-52.

[7]SCHAFERJB,KONSTANJ,RIEDLJ.Recommendersystemsine-commerce:proceedingoftheACMConferenceonElectronicCommerce[C].Pittsburgh:PA,1999:158-166.

[8]PRYORMH.Theeffectsofsingularvaluedecompositiononcollaborativefiltering[EB/OL].(1998).www.cs.dartmouth.edu/reports/TR98-338.pdf.

生物信息学范文篇2

一、正在出现的技术

Klingler(Lncytepharmaceuticals,PaloAlto,CA,USA)强调基因组学正推动制药业进入信息时代。随着不断增加的序列、表达和作图数据的产生,描述和开发这些数据的信息工具变得对实现基因组研究的任务至关重要。他谈到了Incytepharmaceuticals对大规模基因组数据和生物信息学的贡献。

Lipshutz(Affymetrix,Santaclara,CA,USA)描述了一种利用DNA探针阵列进行基因组研究的方法,其原理是通过更有效有作图、表达检测和多态性筛选方法,可以实现对人类基因组的测序。光介导的化学合成法被应用于制造小型化的高密度寡核苷酸探针的阵列,这种通过软件包件设计的寡核苷酸探针阵列可用于多态性筛查、基因分型和表达检测。然后这些阵列就可以直接用于并行DNA杂交分析,以获得序列、表达和基因分型信息。Milosavljevic(CuraGen,Branford,CT,USA)介绍了一种新的基于专用定量表达分析方法的基因表达检测系统,以及一种发现基因的系统GeneScape。为了有效地抽样表达,特意制作片段模式以了解特定基因的子序列的发生和冗余程度。他在酵母差异基因表达的大规模研究中对该技术的性能进行了验证,并论述了技术在基因的表达、生物学功能以及疾病的基础研究中的应用。

二、基因的功能分析

Overton(UniversityofPennsylvaniaSchoolofMedicine,Philadelphia,PA,USA)论述了人类基因组计划的下一阶段的任务——基因组水平的基因功能分析。这一阶段产生的数据的分析、管理和可视性将毫无疑问地比第一阶段更为复杂。他介绍了一种用于脊椎动物造血系统红系发生的功能分析的原型系统E-poDB,它包括了用于集成数据资源的Kleisli系统和建立internet或intranet上视觉化工具的bioWidget图形用户界面。EpoDB有可能指导实验人员发现不可能用传统实验方法得到的红系发育的新的药物靶,制药业所感兴趣的是全新的药物靶,EpoDB提供了这样一个机会,这可能是它最令人激动的地方。

Sali(Rockefelleruniversity,NewYork,NY,USA)讨论了同源蛋白质结构模建。比较蛋白质模建(comparativeproteinmodeling)也称为同源模建(homologymodeling),即利用实验确定的蛋白质结构为模式(模型)来预测另一种具有相似氨基酸序列的蛋白质(靶)的构象。此方法现在已经具有了足够的精确性,并且被认为效果良好,因为蛋白质序列的一个微小变化通常仅仅导致其三维结构的细微改变。

Babbitt(UniversityofCalifornia,SanFrancisco,CA,USA)讨论了通过数据库搜索来识别远缘蛋白质的方法。对蛋白质超家族的结构和功能的相互依赖性的理解,要求了解自然所塑造的一个特定结构模板的隐含限制。蛋白质结构之间的最有趣的关系经常在分歧的序列中得以表现,因而区分得分低(low-scoring)但生物学关系显著的序列与得分高而生物学关系较不显著的序列是重要的。Babbit证明了通过使用BLAST检索,可以在数据库搜索所得的低得分区识别远缘关系(distantrelationship)。Levitt(Stanforduniveersity,PaloAlto,CA,USA)讨论了蛋白质结构预测和一种仅从序列数据对功能自动模建的方法。基因功能取决于基因编码的蛋白质的三级结构,但数据库中蛋白质序列的数目每18个月翻一番。为了确定这些序列的功能,结构必须确定。同源模建和从头折叠(abinitiofolding)方法是两种现有的互为补充的蛋白质结构预测方法;同源模建是通过片段匹配(segmentmatching)来完成的,计算机程弃SegMod就是基于同源模建方法的。

三、新的数据工具

Letovsky(JohnshopkinsUniversity,Baltimore,MD,USA)介绍了GDB数据库,它由每条人类染色体的许多不同图谱组成,包括细胞遗传学、遗传学、放射杂交和序列标签位点(STS)的内容,以及由不同研究者用同种方法得到的图谱。就位置查询而言,如果不论其类型(type)和来源(source),或者是否它们正好包含用以批定感兴趣的区域的标志(markers),能够搜索所有图谱是有用的。为此目的,该数据库使用了一种公用坐标系统(commoncoordinatesystem)来排列这些图谱。数据库还提供了一张高分辨率的和与其他图谱共享许多标志的图谱作为标准。共享标志的标之间的对应性容许同等于所有其它图谱的标准图谱的分配。

Markowitz(LawrenceberkeleyLaboratory,Berkeley,CA,USA)讨论了分布式数据库与局部管理的关系,以及用基于工具的方法开发分子生物学数据库(MDBs)的问题。许多方案当前正在促进搜索多种不同来源MDBs的数据,包括建立数据仓库;这要求对各种MDBs的组合有一种全局观,并从成员MDBs中装填数据入中心数据库。这些方案的主要问题是开发整体视图(globalviews),构建巨大的数据仓库并使集成的数据库与不断发展中的成员MDBs同步化的复杂性。Markowitz还讨论了对象协议模型(objectprotocolmodel,OPM),并介绍了支持以下用途的工具:建立用于文本文件或者关系MDBs的OPM视图;将MDBs作成一个数据库目录,提供MDB名称、定位、主题、获取信息和MDB间链接等信息;说明、处理和解释多数据库查询。Karp(SRIinternational,MenloPark,CA,USA)解释了Ocelot,一种能满足管理生物学信息需求的面向对象知识陈述系统(一种面向对象系统的人工智能版)。Ocelot支持略图展开(schemaevolution)并采用一种新的最优化并行控制机制(同时进行多项访问数据的过程),其略图驱动图形编辑器提供了交互式浏览和编辑功能,其注释系统支持数据库开发者之间的结构通讯。

Riley(MarinebiologicalLaboratory,WoodsHole,MA,USA)在讨论大肠杆菌蛋白质的功能同时,特别提到了GPEC数据库,它包括了由实验确定的所有E.coli基因的功能的信息。该数据库中最大比例的蛋白质是酶,其次则为转运和调控蛋白。

Candlin(PEappliedBiosystems,FosterCity,CA,USA)介绍了一种新的存储直接来自ABⅠPrismdNA测序仪的数据的关系数据库系统BioLIMS。该系统可以与其它测序仪的数据集成,并可方便地与其它软件包自动调用,为测序仪与序列数据的集成提供了一种开放的、可扩展的生物信息学平台。

Glynais(NetGenics,Cleveland,OH,USA)认为生物信息学中最关键的问题之一是软件工具和数据库缺乏灵活性。但是,软件技术的发展已得到了其它领域如金融业和制造业的发展经验的借鉴,可以使来自不同软件商的运行于各种硬件系统的软件共同工作。这种系统的国际标准是CORBA,一种由250多个主要软件和硬件公司共同合作开发的软件体系。联合使用CORBA和Java可以开发各种通过一个公用用户界面访问任何种类的数据或软件工具的网络应用软件,也包括生物信息学应用软件。Overton不同意Glynias的这种想法,他强调说CORBA仅对软件集成有用,不兼容的数据库软件可能是计算生物学所面临的最困难问题,一些制药公司和数据库仓库最近资助了一项用OCRBA链接不同的数据库的计划[2,3]。

四、制药先导的发现

Burgess(Sturcturalbioinformatics,SanDiego,CA,USA)讨论了填补基因组学和药物设计之间鸿沟的蛋白质结构中的计算问题。在缺乏主要疾病基因或药物靶的精确描述数据的情况下,药物设计者们不得不采用大规模表达蛋白质筛选方法;而结构生物信息学则采用一种更为实用有效的计算方法直接从序列数据中确定靶蛋白质的活性位点的精细结构特征,它利用一种集成专家系统从现实的或虚拟的化学文库中进行迅速的计算筛选,可以达到一个很大的规模。

Elliston(Genelogic,Columbia,MD,USA)讨论了治疗药物开发中发现新的分子靶的过程,着重讨论了基因发现方法。他认为,随着日益临近的人类基因组测序的完成,几乎全部基因的特征将在序列水平得到揭示。但是,对基因的认识将有赖于更多的信息而不仅仅是序列,需要考虑的第一类信息是转录表达水平信息,而Genelogic公司的GeneExpress就是一个由mRNA表达谱、转录因子位点、新基因和表达序列标签组成的数据库。

Liebman(Vysis,Downessgrove,IL,USA)介绍了Vysis公司开发的计算和实验方法,这些主法不仅用于管理序列数据,而且被用于以下用途:分析临床数据库和自然—突变数据库;开发新的算法以建立功能同源性(区别于序列同源性)模拟生物学通路以进行风险评估;药物设计的靶评估;联系复杂的通路特性以便识别副作用;开发疾病发展的定性模型并解释临床后果。

随着发现的新基因的日益增多,这个问题显得格外重要:基因的功能是什么?Escobedo(Chirontechnologies,Emeryville,CA,USA)提出了这个问题的一种方法:将分泌蛋白质的基因的功能克隆与筛选这些克隆(可能的药物靶)结合起来。在这种方法中,在微粒体cDNA文库池中进行体外翻译避免了劳动密集的克隆、表达和纯化步聚,对文库池中的翻译产物在细胞水平进行筛选,测试其在细胞增殖和分化中的作用。例如,在用这种方法识别的111个克隆中,56个属于已知的分泌蛋白质,25个为膜相关蛋白,另外30个功能未知,可能是新的蛋白质。一种相似的方法在转移到小鼠模型系统中的基因传导载体中构建分泌蛋白质的cDNA文库来克隆特定的功能基因。

Ffuchs(Glaxowellcome,ResearchTrianglePark,NC,USA)讨论了生物信息学更为广义的影响:它不仅影响到新药物靶基的发现,还对改善药物开发的临床前期和临床期的现状极具重要性。众所周知,涉汲数以千计病人的临床试验(可能是药物开发最为花钱的部分)的设计不论多么仔细,也不能为正确的药物选择正确的病人。而在基因组水平划分病人群体的方法可以大大改善发现新药的效率。Fuchs介绍了一种将病人的基因型和表型标志结合起来以改善临床前期和临床期药物开发过程的系统GeneticinformationSystem.他强调将遗传学和生物信息学数据同化学、生物化学、药理学和医学数据连接起来的集成信息管理和分析方法是极其重要的。

Green(HumanGenomeSciences,Rockville,MD,USA)介绍了他的测序工作中采用的数据管理工具。基于EST的测序方法所面临的挑战是,在对几百个cDNA克复测序之后,产生的数据堆积如山。由于大多数人类基因都是用这种方法发现并在么有数据库中分类编排的,面临的识别开放读框、重叠序列的重叠图谱、组织特异表达和低丰度mRNA基因的任务是令人生畏的。HumangenomeSciences公司开发了一些可用户化数据库工具,在同一个数据库中可包括以下功能:WWW上访问和检索数据,序列拼接,临视潜在药物靶基因的研究进展等。这些能够管理多项任务——从注释基因序列到成功开发基因产物进入药物发现的流程——的软件工具,极其可望从一种基于基因组知识的药物发现方法中得到新的药物靶。

Summer-Smith(Base4bioinformatics,Mississauga,Ontario,Canada)描述了一种相关的策略。药物发现阶段中所要求的软件工具的任务是多样化的,要能注释基因,并阐明它的生理和病理功能及其商业潜质。对这样多种来源的信息的集成与分析,在派生的、项目取向的数据库(project-specificdatabase,PSD)中可以很好完成。由于项目贯穿于发现到开发全过程,其间又不断加入背景的成员,PSD在项目的管理与发展中成为一种关键性的资源。

按照Smith(Bostonuniversity,Boston,MA,USA)的观点[2],我们并不需要更快捷的计算机或更多的计算机科学家,而是需要更的生物学家和生物化学家来解释序列的功能。这对有些软件或硬件专家来说是个打击,但生物学系统的复杂性是令人生畏的,并且对基因功能的认识可能需要生物学方法和计算方法的结合。探索基因的功能很可能要花费生物学家们数十年的时间,本次会议表明没有任何单一的方法可以得出一个答案;但是,将计算生物学同大规模筛先结合起来识别一种化学靶物(hit)是一种产生化学工具来探索基因功能的方法,这些化学工具接下来就可以用作理解基因功能的“探针”。这种方法在Butt(GeneTranscriptionTechnologies,Philadelphia,PA,USA)的描述中,既是一种检查基因功能的简单方法,也是为潜在的药物靶发现化学先导物的简单方法,他描述了一种可以在酵母中重建人类基因功能的酵母大规模筛选系统。在此系统中,可以迅捷地在一个化学文库中发现配基。这种技术的重要特征是它不仅仅是发现一种药物靶的配基的筛板(screen),相反,由于该系统的高速度,它也是发现先导靶基因的一种筛板。过去,世界上的制药公司通常在某一时间内仅能对有限数目(约20多个)的药物靶基因进行工作,鉴于此,我们需要根本不同的方法如基因组学来打开通向“新”生物学的通路。由于机器人和合成化学的进步,药物发现中最关键的问题不再是得到一种先导化合物(leadcompound),而是得到导向靶基因。此次会议为从计算和实验方法中发展出的新生物学迈出很好的一步。

参考文献

1LimHA,BatttR.TIBTECH,1998;16(3)):104

生物信息学范文篇3

[关键词]哲学;生物信息学;融入生物信息学

作为新兴学科,其理论的产生、发展和完善蕴含着丰富的马克思主义哲学思想。哲学作为关于一切运动最普遍规律的学科,对高等教育和生命科学领域复杂问题的解决,显示出了强大生命力[1-3]。哲学是人类思维的高度概括和总结,其原理可以渗透到生物信息学教学的各个章节和领域。就当前国内而言,哲学与其他一级学科的融合发展尚未引起足够重视[3],生物信息学教材中也未出现哲学术语。笔者结合三年教学实践,认为生物信息学课程虽为理科教育,但教学改革过程中穿插引入哲学思维至关重要,自觉渗透哲学原理,将有助于开拓学生视野和优化学生思维。笔者提出,教师要重视哲学思维,善用哲学方法。在总结生物信息学课堂教学不足的基础上,下面从三方面对哲学原理融入课堂教学展开论述。

一、生物信息学课堂教学现状和难题

生物信息学是生物学和信息学的交叉科学,包含了对各种组学数据(转录组、蛋白质组、非编码RNA组、表观遗传组、代谢组、宏基因组等)的获取、处理、存储、分发、分析等以及生物系统层面的解读,综合运用数学、计算机科学、生物学和医学的各种工具,来阐明和理解大量数据所包含的生物学意义[4]。课程理论教学内容包括生物数据库及其信息检索、序列比对与分子进化、核酸序列分析、蛋白质性质和结构分析、基因组信息学、蛋白质组信息学等;实践教学引入了常用生物信息学数据库的应用、核酸和蛋白质序列的比对分析、DNA序列的信息学和功能分析、蛋白质序列分析和结构预测、常用生物软件的应用、综合实验等。学好本课程,准确找出与疾病有关的生物标志物,就是在实现和满足人民对美好生活的向往。当前国内外顶尖的自然科学研究,一定是定量科学(干实验)与实验科学(湿实验)并驾齐驱、相辅相成的一种研究模式。伴随着高通量生物技术的快速发展和后基因组时代的到来,生物信息学课程在国内多所高校纷纷开设,成为生物学本科生必须掌握的基本知识和核心技能。借鉴各兄弟院校的课堂教学经验[5-8],发现国内生物信息学课堂教学目前面临的难题主要有三方面:(1)大多偏重于结论性知识的传授,很少关注理论产生的哲学内涵和思维。(2)课程对教师的授课水平和学生的学习能力要求较高,学生专业基础差,远不能适应生物信息学教学的需要[9]。(3)课程大都处于摸索和起步阶段,教材内容不够全面,实验教学案例不足[10]。深入学习贯彻育人育才思想是新时代教育工作和教师工作的重中之重。从课程理论创新角度看,通过哲学原理从不同角度融入生物信息学课堂教学可以夯实高校育人育才思想根基和满足学科发展需要[11]。

二、马克思主义哲学原理融入课程教学改革的实现路径

(一)以人为本以人为本,注重哲学教育对师生本身的完善。高校教师只有思想上清醒和认同“四有”好教师标准,才能培养出未来更优秀的社会发展中坚力量。部分新任教师虽然学历较高,但思想抛锚、能力不足,距离“四有”好教师尚有差距,接受生物信息学的新理论新观点不够及时,对课堂上学生的个体差异未能完全掌握。新时代新作为,生物信息学教师要时刻牢记人民教师的职责定位,坚持潜心问道和关注社会,增强核心意识,提高政治站位;要在学思践悟中联系新时代中国特色社会主义思想,要当好宣传员、示范员、战斗员,做到内化于心、外化于行;要善于运用马克思主义的世界观和方法论,从哲学角度来认识和把握教学中蕴含的矛盾和问题,实现思想政治教育与知识体系教育的有机统一,为国家培养合格建设者和可靠接班人。大学时期是青年学生树立“三观”的关键时期,具有好学、好思、好问的特质。教师要善于抓住学生可塑性的一面,坚持立德树人,把思想引导和价值观塑造融入教学之中;要注重学生意识形态方面的正确引领和培育,引导他们及早树立理想信念,激发他们主动学习的内生动力;要时刻以高尚的人格魅力赢得学生敬仰,以模范的言行举止感染学生,引导他们在观察、思考、实践和领悟中播撒真善美的种子;要坚持以学生为中心,开发设置一系列辩证统一的问题,引导学生懂得质疑、猜疑、解疑,成为一个具有创新思维、创造力的人。实践证明,生物信息学课堂上的教学出彩大多因为有充分发挥主观能动性、努力思考、求真求实的学生,即使一些出错学生的旁逸斜出也会给教学注入活力。(二)唯物辩证唯物辩证,注重理性思维在课堂上的潜移默化传授。在课堂教学中,课本内容多呈现一般性的解读、普遍性的结论和规律性的认识。若要加深理论的深刻性和科学性认识,就要求教师注重善用唯物辩证法培养学生的批判性思维。注重梳理和画出思维导图,使知识在学生头脑中形成竖成串、横成链的体系化网络。生命大分子无时无刻不在运动和变化,通过生物信息学数据解读系统生物学问题,必须坚持普遍联系地进行分析,培养学生多个视角来思考的习惯、批判性思维能力和集成决策能力。综合运用分析论证理论(比如还原分析、比较分析、挖掘背景、寻找替代等)以及数据挖掘方法(分类、关联分析、聚类分析、异常检测等),说明和预测有哪些问题是可以解决的,有哪些是可以计算的,有哪些仅仅停留在理解层面。例如,生物信息学可以更好揭示生物“表现型=基因型+环境”概念。DNA的表观修饰有近20种,RNA的表观修饰更多,用生物信息学对这些表观修饰进行分析可以扩充“中心法则”的概念,也可以解释为什么表现型不单单由基因型决定,还和所处环境有关。矛盾的对立统一规律是唯物辩证的核心,比如给学生讲解人类基因组计划可以了解疾病健康和基因遗传的关系,但一旦每一个人的基因组测序能够实现,则必然会出现基因歧视和种族灭绝的危险[12]。课堂教学运行是一个师生互动生成的动态过程,教师需要做好预设和生成之间的平衡处理,需要联系理论动态和前沿热点讲述某理论的应用价值以引人入胜,需要简明扼要地定义理论特点和推理过程,需要课后全面总结“预料之内”和“意料之外”的细节处理。教师要分清教师主导性和学生主体性的矛盾、教学内容与逻辑顺序上的矛盾、教学内容和受众对象非对等性的矛盾、教学内容和教材内容差异性的矛盾、教学内容和时间应用上的矛盾等。课程内容设计要坚持矛盾分析法中的“重点论”思维,既要全面又要突出重点。学生学习课程客观上存在各章节时间分配的对立,要把主要精力放在基础理论掌握和应用上;另一方面,课程各章节之间客观上存在内容相关的统一,也要求学生了解其他关联章节。在千头万绪的各类数据库中,学生要善于抓住编程中推理分析的主要矛盾和矛盾的主要方面,玩出高雅,悟出智慧,学出成绩,活出价值。(三)知行合一知行合一,注重理论联系实际和实践育人。理论指导实践,实践检验和丰富理论。课程理论抽象、实践性强,背后隐藏了许多识别模式和顺序,要求学生首先掌握生命科学和数理统计知识,并拥有数据库、数据可视化和各类编程语言如Python等基础知识。产业界的大数据人才,还要求掌握额外的关键技能,如文本挖掘、本体论、数据集成、机器学习和信息架构等,包括一系列的统计能力、计算能力和核心的编程能力,如C++或Java的编码,或PERL或Python的脚本编写,能够控制操作系统如Linux,并具备促使数据可视化和建立简约优美有效的用户界面的能力。实现以上目标,不仅要联系本地区学生实际循序渐进开展理论教学,更要注重引入实践不断健全课堂教学环节。完整的生物信息学课堂教学环节包含传统讲授、师生讨论、上机实验和写作训练。通过介绍我国大数据领域科学家的故事,引导学生崇尚科技创新、精益求精和用户至上的工匠精神。通过介绍中国参与人类基因组计划、无创产前基因检测技术、癌症早期诊断等,培养学生爱国忧国情怀。在授课中,教师要抓住知识体系的两条主线:序列—结构—功能—进化;基因组—转录组—蛋白组—代谢组,多组学贯穿。教师要善于用接入外部互联网的多媒体网络教室演示生物信息学理论、数据库搜索及软件应用等,便于师生课堂交流。教师在课堂上要鼓励学生随时提问,培养他们的批判性思维和创新思考能力,将传统的“传递”与“接受”转变为积极主动的“发现”和“建构”。通过与学生心平气和、推心置腹地交流沟通和答疑解惑,让学生产生共鸣。教学不仅在课堂,更在课后,教师不仅要重视理论知识的传授,更要强调学生知识建构能力的培养和生信技能的实际运用。要课后指导学生自己制订实践教学方案,鼓励学生利用生物信息学网络开放课程优质资源。例如,课堂上在介绍生物信息学的序列比对用法后,要求学生独立从公共数据库下载数据,挖掘有用信息完成上机操作。另外,要充分利用教师申报的各类科研项目,积极组建学生团队开展生物信息学相关毕业设计训练,提高就业竞争力。最后,要通过写作体现学生的逻辑思维和人生感悟,并要求学生在课堂上通过幻灯片明晰透彻地报告所得结果。学完课程后,学生们将有能力进行数据库搜索、序列比对、蛋白质结构预测等,最终达到预期的教学效果。

三、马克思主义哲学原理融入生物信息学教学实践的体会

马克思主义哲学原理内涵丰富,蕴藏着无穷魅力,值得我们去实践创新。它不仅包含了本文所探讨的一些观点,还包括许多经典的思想方法。比如,从有限到无限去领略基因组变化,从量变到质变去体验蛋白质网络和代谢网络变化,从静态到动态去感悟多序列分析算法规律,等等,这需要我们不断实践摸索。目前很多课堂面临学生思维活动活跃度低、师生缺少互动和“低头族”等难题,而育人育才重在育心育脑,因此,在课程教学中通过科学的思维方法传授科学知识显得愈加迫切。通过哲学原理有效融入课堂教学,使师生共有哲学思想,就容易达到同频共振和培养默契。一方面,促进教学组完善课程设计,注重挖掘生物信息学课程中的哲学素材,并使用部分哲学观点加以说明和解释;另一方面,学生一旦开始注重运用哲学经典理论指导学习,将方便构建起相应的知识网络,整体把握课程知识脉络的前提和界限,“自觉”相信马克思主义哲学的正确性和指导性。学生只有把哲学原理转换成实践操作技能,才能将哲学血肉化,避免花费大量时间刷题和死记硬背概念性、理解性知识,显著提高了学生的动手分析能力和创新能力。

生物信息学范文篇4

[论文摘要]生物信息学是80年代以来新兴的一门边缘学科,信息在其中具有广阔的前景。伴随着人类基因组计划的胜利完成与生物信息学的发展有着密不可分的联系,生物信息学的发展为生命科学的发展为生命科学的研究带来了诸多的便利,对此作了简单的分析。

一、生物信息学的产生

21世纪是生命科学的世纪,伴随着人类基因组计划的胜利完成,与此同时,诸如大肠杆菌、结核杆菌、啤酒酵母、线虫、果蝇、小鼠、拟南芥、水稻、玉米等等其它一些模式生物的基因组计划也都相继完成或正在顺利进行。人类基因组以及其它模式生物基因组计划的全面实施,使分子生物数据以爆炸性速度增长。在计算机科学领域,按照摩尔定律飞速前进的计算机硬件,以及逐步受到各国政府重视的信息高速公路计划的实施,为生物信息资源的研究和应用带来了福音。及时、充分、有效地利用网络上不断增长的生物信息数据库资源,已经成为生命科学和生物技术研究开发的必要手段,从而诞生了生物信息学。

二、生物信息学研究内容

(一)序列比对

比较两个或两个以上符号序列的相似性或不相似性。序列比对是生物信息学的基础。两个序列的比对现在已有较成熟的动态规划算法,以及在此基础上编写的比对软件包BALST和FASTA,可以免费下载使用。这些软件在数据库查询和搜索中有重要的应用。有时两个序列总体并不很相似,但某些局部片断相似性很高。Smith-Waterman算法是解决局部比对的好算法,缺点是速度较慢。两个以上序列的多重序列比对目前还缺乏快速而又十分有效的算法。

(二)结构比对

比较两个或两个以上蛋白质分子空间结构的相似性或不相似性。

(三)蛋白质结构预测

从方法上来看有演绎法和归纳法两种途径。前者主要是从一些基本原理或假设出发来预测和研究蛋白质的结构和折叠过程。分子力学和分子动力学属这一范畴。后者主要是从观察和总结已知结构的蛋白质结构规律出发来预测未知蛋白质的结构。同源模建和指认(Threading)方法属于这一范畴。虽然经过30余年的努力,蛋白结构预测研究现状远远不能满足实际需要。

(四)计算机辅助基因识别

给定基因组序列后,正确识别基因的范围和在基因组序列中的精确位置.这是最重要的课题之一,而且越来越重要。经过20余年的努力,提出了数十种算法,有十种左右重要的算法和相应软件上网提供免费服务。原核生物计算机辅助基因识别相对容易些,结果好一些。从具有较多内含子的真核生物基因组序列中正确识别出起始密码子、剪切位点和终止密码子,是个相当困难的问题,研究现状不能令人满意,仍有大量的工作要做。

(五)非编码区分析和DNA语言研究

在人类基因组中,编码部分进展总序列的3-5%,其它通常称为“垃圾”DNA,其实一点也不是垃圾,只是我们暂时还不知道其重要的功能。分析非编码区DNA序列需要大胆的想象和崭新的研究思路和方法。DNA序列作为一种遗传语言,不仅体现在编码序列之中,而且隐含在非编码序列之中。

三、生物信息学的新技术

(一)Lipshutz(Affymetrix,Santaclara,CA,USA)

描述了一种利用DNA探针阵列进行基因组研究的方法,其原理是通过更有效有作图、表达检测和多态性筛选方法,可以实现对人类基因组的测序。光介导的化学合成法被应用于制造小型化的高密度寡核苷酸探针的阵列,这种通过软件包件设计的寡核苷酸探针阵列可用于多态性筛查、基因分型和表达检测。然后这些阵列就可以直接用于并行DNA杂交分析,以获得序列、表达和基因分型信息。Milosavljevic(CuraGen,Branford,CT,USA)介绍了一种新的基于专用定量表达分析方法的基因表达检测系统,以及一种发现基因的系统GeneScape。为了有效地抽样表达,特意制作片段模式以了解特定基因的子序列的发生和冗余程度。他在酵母差异基因表达的大规模研究中对该技术的性能进行了验证,并论述了技术在基因的表达、生物学功能以及疾病的基础研究中的应用。(二)基因的功能分析

Overton(UniversityofPennsylvaniaSchoolofMedicine,Philadelphia,PA,USA)论述了人类基因组计划的下一阶段的任务基因组水平的基因功能分析。这一阶段产生的数据的分析、管理和可视性将毫无疑问地比第一阶段更为复杂。他介绍了一种用于脊椎动物造血系统红系发生的功能分析的原型系统E-poDB,它包括了用于集成数据资源的Kleisli系统和建立internet或intranet上视觉化工具的bioWidget图形用户界面。EpoDB有可能指导实验人员发现不可能用传统实验方法得到的红系发育的新的药物靶,制药业所感兴趣的是全新的药物靶,EpoDB提供了这样一个机会,这可能是它最令人激动的地方。

Babbitt(UniversityofCalifornia,SanFrancisco,CA,USA)讨论了通过数据库搜索来识别远缘蛋白质的方法。对蛋白质超家族的结构和功能的相互依赖性的理解,要求了解自然所塑造的一个特定结构模板的隐含限制。蛋白质结构之间的最有趣的关系经常在分歧的序列中得以表现,因而区分得分低(low-scoring)但生物学关系显著的序列与得分高而生物学关系较不显著的序列是重要的。Babbit证明了通过使用BLAST检索,可以在数据库搜索所得的低得分区识别远缘关系(distantrelationship)。Levitt(Stanforduniveersity,PaloAlto,CA,USA)讨论了蛋白质结构预测和一种仅从序列数据对功能自动模建的方法。基因功能取决于基因编码的蛋白质的三级结构,但数据库中蛋白质序列的数目每18个月翻一番。为了确定这些序列的功能,结构必须确定。同源模建和从头折叠(abinitiofolding)方法是两种现有的互为补充的蛋白质结构预测方法;同源模建是通过片段匹配(segmentmatching)来完成的,计算机程弃SegMod就是基于同源模建方法的。

(三)新的数据工具

Letovsky(JohnshopkinsUniversity,Baltimore,MD,USA)介绍了GDB数据库,它由每条人类染色体的许多不同图谱组成,包括细胞遗传学、遗传学、放射杂交和序列标签位点(STS)的内容,以及由不同研究者用同种方法得到的图谱。就位置查询而言,如果不论其类型(type)和来源(source),或者是否它们正好包含用以批定感兴趣的区域的标志(markers),能够搜索所有图谱是有用的。为此目的,该数据库使用了一种公用坐标系统(commoncoordinatesystem)来排列这些图谱。数据库还提供了一张高分辨率的和与其他图谱共享许多标志的图谱作为标准。共享标志的标之间的对应性容许同等于所有其它图谱的标准图谱的分配。

Candlin(PEappliedBiosystems,FosterCity,CA,USA)介绍了一种新的存储直接来自ABⅠPrismdNA测序仪的数据的关系数据库系统BioLIMS。该系统可以与其它测序仪的数据集成,并可方便地与其它软件包自动调用,为测序仪与序列数据的集成提供了一种开放的、可扩展的生物信息学平台。

参考文献:

生物信息学范文篇5

关键词:生物技术专业;生物信息学;教学方法;教学改革

生物信息学(Bioinformatics)是随着人类基因组计划完成,越来越多物种的全基因组测序计划开启。生物信息学又是一门集数学、计算机科学和生物学于一体的综合性学科,是从海量生物学数据信息中获取、处理、存储、解析和阐述等,并利用数学和计算科学来解析生命科学奥秘的交叉学科。它是当今生命科学和自然科学的前沿领域之一,也是21世纪生物技术的核心领域,具有前沿性新、交叉性广、实践性强等特点[1]。因此,地方农业研究型高校开设的生物技术专业会将生物信息学课程作为人才培养方案中的核心课程,以满足生物技术行业对人才的迫切需要。在生物技术专业的课程中,生物信息学是生物技术专业重要的专业核心课,是基础课与专业课之间的纽带与桥梁课程,是成为生物技术专业教师开展科研工作的重要工具,也是生物专业本科生综合运用所学专业知识提升专业技能途径。生物信息学要学好,本科学生要有扎实的植物学、动物学、遗传学、细胞生物学、生物化学和分子生物学等基础生物学知识,但由于地方农业院校基础课程教学相对薄弱,学生的基础知识较为匮乏,同时教师多以传统的“讲解式”和“启发式”教学方法为主,教学内容紧凑且进度快,实验操作较少,使得学生在学习“生物信息学”课程时听不懂、记不住、学不好,直接影响并降低了学生的学习积极性。本文针对吉林农业大学生物技术专业的生物信息学课程的教学现状,分析和总结了教学环节中存在的主要问题,从教学方法、课程内容和考核方式等几个角度进行教学模式的探讨,以期在今后的教学环节取得更好的教学效果,提升学生对该课程的学习兴趣。

1地方农业高校生物信息学课程的教学现状与存在问题

生物信息学是一门集多学科知识体系综合交叉性强的前沿学科,对该课程的专业教师要求储备较强的生物科学知识和计算科学知识,还要将科学前沿知识与课程教育相融合,更要建立系统的完善的生物信息学知识板块,这些都导致地方农业高校缺乏生物信息学师资队伍,并影响我国农业生物信息学教育快速发展。1.1教学资源匮乏,教学内容过于陈旧。近些年,生物信息学发展速度较快,但地方农业高等院校开设时间相对较晚,课程设置内容单一、课程的建设方面投入较少。生物信息学是一门新兴学科,学科发展时间较短,缺少丰富的多媒体资源、教学视频、精品课等重要的教学资源,使其教学资源稀缺匮乏。同时,使用的教材和教学内容过于陈旧,不能满足学科的快速发展,更不能及时进行教学内容的更新。1.2学生专业知识基础差,理论功底不扎实。地方农业院校的学生在知识储备和数据分析能力上与综合性大学理工科学生存在差距。生物信息学课程理论性较强,地方农业高校学生在数学、计算机和专业英语等基础知识方面不够扎实,对生物信息学涉及的核心原理、应用算法等内容难以理解和消化,这些因素导致地方农业高校学生接受生物信息学课程的重要知识点存在较大困难,从而使部分学生的学习效果较差,不能灵活运用所学。1.3教学模式单一,学时少。目前,国内的生物信息学依旧是讲授式的传统教学模式,以理论讲授为主体,实验操作为辅助,以课堂为中心进行“满堂灌”式教育,从而导致缺乏突出生物信息学课程特点的新式教学模式。以一般地方农业高校的生物信息学课程总学时32学时,理论教学为24学时,实验学时仅为8学时,学时数较少,理论基础讲解不透彻,实验操作内容简单,对学生感兴趣和具有实际应用价值的软件无法进一步操作和实践应用。

2地方农业高校生物信息学教学模式的改革建议

2.1权威优质教材的选用。优质的教材是一门课程有序延伸的基础。生物信息学起源于国外,早期的课程教材均以翻译本为主,近几年我国生命科学发展较快,国内学者编著的教材越来越多,后期的教材均以国产教材为主,翻译教材为辅。但教材的数目繁多,2018年,曾有学者对我国这门学科教材进行评价,主要将其分为两大类,一类以生物信息学基本理论知识的讲解为主,主要介绍生物信息学发展史,与生物信息学相关的生物学理论,例如,遗传学、基因组学、蛋白质组学以及代谢组学等。与生物信息学相关的数学、统计学和计算机理论。例如,计算生物学、数据结构与模型以及网络数据库等,这类教材相对系统全面地介绍了生物信息学的基本概念和研究内容。另一类则以生物信息学技术和方法的应用为主,着重介绍各种数据库,以及数据分析软件、工具的使用方法和技巧,这类教材在生物信息学相关理论方面涉及较少,重点在于培养学生的实际操作能力。在我国现有的生物信息学教材中,陈铭主编的《生物信息学》(第3版)是国家规定的“十三五”规划教材,权威性较高。从内容也可以看出,《生物信息学》(第3版)的核心内容是生物信息学的理论和方法,基础性、系统性较强,是理论教学的首选参考书。而吴祖建等主编的《生物信息学分析实践》是一本以实用性为主的教材,主要内容为介绍各项试验、数据库、及分析软件的操作方法,同时会用一些实例来介绍各项操作和技术,通俗易懂,是实验和实践教学教材的首要选择。针对地方农业高校出现的学生理论基础较差,动手能力不强的现象,选择将《生物信息学》(第3版)作为基础理论教材,配合《生物信息学分析实践》作为实验和实践教材,既可以增强学生的理论知识功底,又可以培养学生的实践动手能力,有利于培养专业实践型人才。2.2教学方法的选择。随着教学技术的发展及科技的进步,教育方法也不断发展,先进的科学技术也逐渐普及。生物信息学是在生物学、数学和计算机科学等专业的基础上建立起来的,因此,生物信息学教学课程一般安排在学生学习过生物学基础课程、数学和计算机科学学习后进行。前期的生物学教学基础包括遗传学、生物化学、分子生物学、细胞生物学和基因组学等课程。以吉林农业大学生物技术专业为例,将该门课程设置在第六学期开设,包括上机实习在内共40学时,理论内容占20学时,实验和实践内容占20学时(由5个专题实验组成)。与此同时要督促学生进行自学,生物信息学的大部分内容是数据资料库及相应的分析软件,均可在线操作。课堂上的多媒体不能完全保障学生的学习效果,在保证网络稳定的情况下,可以让学生自己进行操作学习,加深记忆,并掌握操作方法。2.3教学方式的改进。2.3.1实行“以点带面”的教学方式。生物信息学的理论教学内容为数据库的使用及实验分析软件工具的使用。生物信息学的数据库琳琅满目,数量庞大,其中,以隶属于美国国立医学图书馆的国立生物技术信息中心NCBI数据库、隶属于欧洲生物信息研究所EMBL数据库、瑞士日内瓦大学的SWISS-PROT蛋白质数据库以及蛋白质结构数据库PDB等为主要代表。以上几个数据库较为著名,而且属于综合性数据库,可以将NCBI、EMBL、SWISS-PROT、PDB等常用核酸、蛋白质数据库,以及这些数据库中的重要功能,如BLAST、Pubmed、OMIM、EXAPASY等进行重点介绍,以其他数据库进行特点补充,“以点带面”进行教学,既能使学生了解常规的数据信息,又可以根据自身的兴趣挑选其他数据库进行应用。同时,生物信息分析的软件工具种类也较多,在实际教学中可以先选择最常用的核酸、蛋白质分析软件,如:DNAMAN、Primer5.0、BioEdit、ClustalW、MEGAX等软件为突破口,让学生掌握其基本操作,同时引入其他软件的优缺点,让学生了解其优势功能,起到“以点带面”的作用。实验和实践教学内容可以采用仿真模拟操作,并操作方法流程图教学的方法。尝试为学生提供几个基因或蛋白质名称,通过数据库查询获得基因,然后,进行Blast搜索比对,结构和序列分析等操作,使学生对基因或蛋白质的性质、功能等有着深刻的了解,并在教师指导下深入解读,同时可以将部分内容通过实验课、项目研究及大学生竞赛等形式进行论证,既能调动学生的学习积极性,激发学生的学习兴趣,又能使学生清晰了解如何使用数据库和软件分析。科研及实践相结合的教学方式还会提高学生的创新实践能力,增强科研思维意识,为以后的进一步深造和熟练应用技术打下良好的基础。2.3.2重视英语教学当前著名的综合型数据库和主流分析。软件都来源于国外,因此,界面为英文,而且有大量的专业词汇都是用英文表示,英文水平相对较弱的学生应用起来较为吃力。针对这种情况,可以在授课中先介绍相关英文概念,等待学生熟悉后再进行操作上教学,以免学生在操作时发生错误,从而产生抗拒情绪。引导注重英语单词的教授不仅可以提高学生的学习效率,还可以提升教师的素质,在不断的提高和完善中,实现培养高层次人才的目标。

3结语

生物信息学范文篇6

【关键词】生物信息学;课程思政;工匠精神;课程教学

在2016年召开的全国思想政治工作会议中指出:要把思想政治工作贯穿于教育教学的全过程,坚持立德树人,将各类课程与思想政治课同向同行,形成协同效应[1]。生物信息学是利用应用数学、信息学以及计算机科学的方法研究生物学的问题,生物信息学主要是分子生物学与信息技术的结合体,其属于多学科相互渗透和高度交叉形成的学科,也是一门实践性较强的基础课程。随着生物学技术的不断发展,尤其是2020年爆发的病毒肺炎疫情暴露出当前生物信息学研究的重要性,同时也对高校学生提出了新的要求,要求其不仅要具有专业的知识体系,还要具备创新、钻研的精神。因此在新时代环境下高校要构建生物信息学思想课程体系,以此培养高质量的生物信息学人才。

一、《生物信息学》思想政治课程教学目标

“课程思政”是专业课程与思想政治教育的有效结合,其主要是通过对专业课程所蕴含的思想政治资源进行充分挖掘整理,根据思想政治内涵与专业知识之间的关联度进行重新整合,以此将课程教学聚焦于全方位育人上面。《生物信息学》是一门工具课,采用数学、统计学以及计算机等方法分析生物学、生物物理学数据的一种综合学科,生物信息学的主要任务就是处理生物学数据。生物信息学数据处理是一项非常严谨的工作,需要学生要严格按照生物信息数据进行计算处理,因此要求学生具有扎实的钻研意识和吃苦耐劳的精神。随着生物大数据技术的不断发展,该课程的重要性日益突出,但是在实践教学中普遍存在中学生专业性和技术性的培养,而忽视探索精神、创新精神以及核心价值观等思想教育的融入,导致学生的实践应用综合素质不高,因此在《生物信息学》课程教学中构建思想政治教育资源,并建立与之对应的课程标准与评价体系,实现专业课“知识传授与价值引领相结合”的教学目标。(一)引导学生树立正确的“三观”意识,提高“四个认识”。多次强调高校是思想政治教育的主阵地,“四个认识”是高校思想政治教育的主要目的。在新时代高校人才培养中,构建专业课思想政治体系是新时代高校教育的最终目标,在《生物信息学》课程建设中通过融入思想政治内容是引导学生树立正确“三观”的重要举措。《生物信息学》是一门工具性课程,需要学生在平时的实践操作中锻炼自己的实践能力,同时生物信息学是一门严谨的课程,需要学生处理复杂的数据,这就要求学生必须要具有扎实的钻研精神。因此构建思政课程则可以在生物信息教学过程中有目的地引导学生树立正确的学习观念,树立严谨的科研精神,满足为了研究和开发岗位的要求。(二)凝练大国工匠精神,培养专注型人才。《生物信息学》突出实践研究创新,其与工匠精神具有内在的密切联系性:一方面在突出科技强国战略的下,《生物信息学》是创新型生物科技人才培养的基础课程,诸多内容知识是现代工匠人才培养的基础。而思想政治教育的核心就是增强学生的爱国情怀,积极投入到新时代中国建设中。工匠精神是民族发展的动力,因此《生物信息学》是凝练大国工匠精神,培养专注型人才的基础课程。(三)用辩证思维为专业创新提供内驱力,提升学生的职业创新精神。《生物信息学》是生物专业的一门基础性学科,其主要是让学生掌握针对基因如何进行数据查询、计算机软件分析其序列、可能的结构和功能。随着生物信息技术的不断发展,要求学生必须要树立职业创新精神。例如2020年爆发的病毒肺炎就属于一种新型的基因种类,人类在战疫情中必须要主动作为,掌握其规律以及基因排序等,以此加快研究出疫苗的速度。而这就需要相关研究人员要具备创新精神和钻研精神。生物学是相互矛盾的学科,是在不断发展中发展的,因此在具体的教学中通过与辩证思维的结合能够引领学生运用辩证的思维去学习生物学知识,去攻克生物难题[2]。

二、《生物学信息学》“课程思政”教学的方法途径

《生物信息学》“课程思政”教学是落实新时代中国特色社会主义思想、培养新时代“三全”人才的重要举措,是推动高校课程改革的重要手段。面对大数据技术在高校教学体系中的应用,实现《生物信息学》课程思政教学必须要从以下几方面着手。(一)构建在线教育模式,利用“雨课堂”对学生进行高效的课堂教学与课后指导。生物信息学不同于传统生物学,其本身是一个混合体。《生物信息学》“课程思政”教学是一个综合性的过程,要求教师按照具体的课程模块有效地引入思想政治教育元素,以此达到专业学习与职业道德素养的双效增效。根据调查在《生物信息学》“课程思政”教学中存在教学形式单一、学生学习积极性不高的问题。例如在“常用分子生物学数据库”学习中,在该模块有效地引入了职业道德教育的内容,鼓励学生发挥钻研精神。但是根据调查由于教学方式的枯燥单一,导致学生独立学习锻炼的积极性不高。因此高校要借助大数据平台的优势,利用“雨课堂”对学生进行有效的指导:一是利用“雨课堂”实施高校课堂教学。《生物信息学》具有很强的实践性,如果单独依赖于书本知识,难以提高学生的知识面,制约学生实践能力的提升[3]。利用“雨课堂”可以将优质的教学资源引入到课堂教学中,这样有助于增强学生解决各种生物科学领域问题的能力。例如针对的影响,高校教师可以利用线上教学的模式,及时将围绕国家生物信息中心信息库的构建、基因组分析、针对肺炎老药新用的机器学习探索和肺炎临床诊断中的AI影响分析等被国内外同行高度认可的代表性研究成果传递给学生,激发学生的探索欲望、调动他们参与实践研究的积极性,形成严谨的科研风气。(二)组织学生进行课堂讨论,通过讨论激发学生的科学探索精神。课堂讨论也是检验学生学习成效的重要方式,通过课堂讨论不仅能够让教师了解学生的学习情况,而且还可以通过讨论掌握学生的职业道德素质、人文精神、创新能力等因素。因此在具体的《生物信息学》“课程思政”教学中:一方面要积极组织学生进行专题讨论。讨论教学法的精髓在于围绕精选案例进行情境化讨论,潜移默化地发展学生的批判性思维,提高其明辨是非的能力。为了切实提升学生严谨的科研风气,树立不怕困难的精神,例如教师可以采用社会上比较热议的话题作为开端,通过学生的探讨增强学生的学习积极性,增强思想政治意识。例如基于2020年肺炎的发生,教师可以组织学生对状病毒的基因问题进行深入的探讨,当然学生探讨的结果不重要,关键是通过学生的探讨让学生认识到社会主义制度的优越性、认识到生物学研究的重要意义[5];另一方面要通过有效的课堂讨论引导学生形成科学探索的精神。讨论的最终目的是掌握专业知识,树立探索精神,因此在课堂讨论中教师既要尊重学生的主体性,给予学生相对自由的发言环境,也要注意合理引导,通过引导让学生形成正确的观念。(三)创新教学考核方式,突出实践综合应用能力。教学考核是客观评价教学成效、促进学生学习积极性的重要手段,不同于一般课程,《生物信息学》课程具有很强的实践性,因此在具体的教学中,需要教师采取多元化的教学考核方式:一是对于理论知识的考核主要是以课堂表现与期末考试的方式进行。例如对于“绪论部分”则是考核学生对人类基因发展进程的了解,对于该部分可以采取笔试考试的方式。当然考核的主要目的就是让学生通过了解人类基因组计划进展,增强民族自豪感,认识到我国基因发展的成就,以此致力于投入到生物信息研究中;二是对于实践部分的考核要以过程考核为主,突出实践表现能力。《生物信息学》课程具有很强的实践性,因此在具体的考核中必须要改变传统的侧重理论知识的考核模式,将职业素养、职业技能与探索精神融入到教学考核体系中。例如高校在《生物信息学》考核的时候既要侧重对专业知识的考核,比如可以通过项目操作的方式检验学生的专业知识掌握程度,同时还要注重考核方式的创新,尤其是改变过去单独以笔试分数为唯一标准的模式,侧重对学生钻研精神、科研态度以及社会责任感等维度的考核,适应生物学科发展要求[4];三是构建课堂教学+实践操作+平时表现现结合的考核模式。另外在教学中还要科学设置教学内容,增强社会联系性。在具体的教学中必须要密切结合社会实际对《生物信息学》教学内容进行设置:一是要对教学内容进行优化设计,构建主题化教学模式,例如在具体的课堂教学上,教师在设置教学内容时需要融入最新的社会事件,以此增强学生的学习兴趣。例如在讲解基因组学章节时,教师在内容选择上可以融入我国大数据技术发展的最新信息,这样能够有效激发学生对我国技术创新的自豪感;二是对照学生学情,构建差异化的教学内容,增强教学的实效性。

三、结语

总之《生物信息学》“课程思政”教学并不是简单的“课程”加“思政”,两者不是机械组合,而是在充满“硬核”专业知识的课程中融入思想政治元素,将大水漫灌、硬性楔入的模式转变为精准滴灌、点滴渗透。因此在全面深化高校教学改革的背景下,生物信息学“课程思政”教学工作必须要立足于新时代人才培养教学目标,遵循学生的学情,依托大数据平台,创新生物信息学课程思政的考核方法,以此提升高校人才培养的质量。

【参考文献】

[1]在全国高校思想政治工作会议上强调:把思想政治工作贯穿教育教学全过程开创我国高等教育事业发展新局面[N].人民日报,2016-12-09

[2]李菲,朱先洋.研究生专业教育与思想政治教育融合问题研究[J].中小企业管理与科技2018,12

[3]张晶,杨志刚,薛依婷.生物药剂学“课程思政”教学改革研究[J].农业科技与装备,2019,1

[4]姜献群.高校生物科学专业实施“课程思政”的路径[J].南阳师范学院学报,2020,3

[5]赵志新,吴珍.应用型本科高校生物信息学课程教学改革初探[J].教育教学论坛,2018,8

[6]丁冲,杨文荣.基于课程思政理念下的“电路”课程教学改革[J].电气电子教学学报,2019,6

[7]肖萍.《金融时间序列分析》实施课程思政教学的探索[J].南方农机,2020,2

生物信息学范文篇7

关键词:大数据时代;医药类硕士研究生;生物信息学;通识教育

与现代分子生物学全面融合是当前生物医药发展的显著特征。随着各种高通量测序技术和仪器分析技术的不断发展,生物医药研究数据呈现爆炸式增长。常见的大鼠、小鼠等模式动物和人类自身研究数据,包括基因组学、转录组学、蛋白组学、代谢组学、脂质组学和糖组学等多组学数据以及小分子结构与理化性质、化合物活性与毒性、蛋白结构与活性位点、药物代谢等大规模实验数据等已成为人类疾病和药物研发的基础资源,同样也是医药类硕士研究生学习和开展课题研究必需的参考资料。面对海量的数据资源,以生物医药大数据研究为核心的生物信息学技术已经发展成为现代生物医药研究不可或缺的支撑。生物信息学作为一门发展迅速的交叉学科,其概念对许多研究生而言并不陌生,但对其核心研究内容和常用的研究方法、技术,大家却知之甚少[1-2]。结合当下生物医药大数据时代特征,尝试将生物信息学列为医药类硕士研究生的通识教育课程,并在研究生培养过程中进行教学实践,现将一些体会整理如下,以期让医药类硕士研究生得到更好的发展。

1生物信息学通识教育的教学内容

生物信息学领域的数据库种类繁多,功能各异,面向生物医药研究的各个领域,但最核心的依然是各种类型的生物大分子序列(DNA、RNA、蛋白质)信息。在有限的学时内,了解和认识当前主要的数据平台和分析工具,掌握数据存储、整理分析的常用方法,将会给生物医药研究提供丰富的知识借鉴,这也是医药类硕士研究生应该具备的基本科研素养之一。在生物信息学通识教育课教学实践中,我们将“网络数据平台的认识”作为基础教学内容,其包括:(1)美国国立生物技术信息中心NCBI的GenBank国际核酸序列数据库;(2)U-niprot蛋白质数据库;(3)HMDB代谢物数据库;(4)METLIN(ScrippsResearchInstitute)代谢物质谱数据库等。上述数据平台大多对全球科研工作者、教育工作者以及学生等提供免费服务,是医药类硕士研究生教育和科研极好的网络资源。同时,网络平台工具的选择与学习也是生物信息学通识教育的核心内容之一。生物信息学领域的网络平台工具种类繁多,对于基本生物信息学的分析,包括核酸序列中基因的发现、酶切位点和开放阅读框分析、编码蛋白理化性质预测、二级结构分析、信号肽分析、蛋白质保守结构域分析、跨膜区预测、亚细胞定位预测和三维同源建模等均有较多的在线工具。在教学过程中,我们主要对欧洲生物信息学研究所和丹麦技术大学生物信息学中心等提供的在线分析程序进行了介绍。此外,也将一些常用离线分析软件,例如Mega6、DNAMAN8、BioEdit等进行了简单介绍。除此之外,对于可免费获取的生物信息学深度学习软件,例如MetaboAnalyst3.0、Cytoscape3.6.0以及OmicShare,也进行了初步介绍。另外,对于与生物信息学发展密不可分的R语言的学习与应用,我们也向学生做了简单介绍。当然,生物信息学发展日新月异,各种新工具层出不穷,教学内容不可能全都涉及,而作为一门面向硕士研究生的通识教育课程,主要是希望起到一个引导作用,培养硕士研究生相关方面的基本知识素养。

2生物信息学通识教育的教学方法

在教学实践中,我们将生物信息学课程的总学时设置为18学时,计1学分。此课程以小组讨论式教学为主,不单独设置实验课程,而根据教学需要,随时进行互联网和计算机操作演示及练习。这样的教学模式虽然进度稍慢,但对于所讲内容,都经过学生亲自操作,并且对课程所涉及的内容都提供网络资源和链接,学生能获取详细资料,对所需软件能实时下载安装,这些都给他们后续的课题研究和学习、论文写作等打下了良好的基础。与此同时,借助我校毗邻广州生物岛(岛上生物信息技术公司众多)的优势,在课程教学期间,邀请生物信息技术服务公司技术支持或项目工程师来校举办专题讲座,一方面,让学生熟悉最新的生物信息学发展动态;另一方面,加深学生对生物信息学技术服务市场供给侧的了解,为他们在后期课题研究中遇到问题提供可咨询的渠道。

3生物信息学通识教育教学实践与体会

3.1以科研项目为基础的案例式教学效果好。由于生物信息学课程任课教师在其承担的科研项目中都涉及生物信息学分析内容,因此,我们要求教师基于自身承担的科研项目进行案例式教学。从教师和学生的反馈来看,效果较好。在案例式教学中,一方面,任课教师对所需进行的生物信息学分析思路和方法都很熟悉,能更好地开展教学;另一方面,学生能感受到生物信息学在生物医药科研中的重要作用。3.2课堂讨论与现场实践结合能促进教学转化。生物信息学课程教学离不开网络和计算机,因此,要求教师从自身科研项目中筛选合适的内容,比如,对某一候选基因进行生物信息学分析、对某一组差异表达基因和差异代谢物数据进行调控网络分析等,先组织学生讨论,再引导学生一步一步实践操作,让他们亲身经历并积累相关经验,为后期独立开展课题研究打下基础。3.3合理的课后作业能强化课堂学习效果。在教学实践中我们发现,面对海量的网络数据资源,要使学生学会有效甄别,仅靠有限的课堂学时远远不够。合理布置课后作业,例如让学生结合专业进行有针对性的生物信息学分析训练,对强化课堂学习效果有很好的促进作用。

4结语

生活在生物医药大数据时代,生物信息学对生物医药研究的重要性日益凸显,社会和行业发展对医药类硕士研究生生物信息学素养的要求也不断提高[3-5]。我们在课程教学中不断探索实践,已形成了具有一定特色的生物信息学通识教育教学方法,这为今后培养高素质、创新型生物医药人才奠定了基础。

参考文献:

[1]李姗,王丽,孙洁,等.中医药院校研究生生物信息学教学初探[J].中医药管理杂志,2017,25(20):46-48.

[2]张亮,李玲,单莉娅,等.大数据背景下关于医学研究生生物信息学课程改革的思考[J].医学教育研究与实践,2016,24(6):919-921.

[3]吴风瑞,陈德宇,姜双林,等.PBL教学法在硕士研究生生物信息学教学中的应用[J].阜阳师范学院学报,2017,34(2):109-111.

[4]罗晓霞,夏占峰,王建明.生物信息学课程“教研一体化”教学模式初探[J].教育现代化,2017(52):57-59.

生物信息学范文篇8

关键词:生物信息学;计算机技术;创新发展

生物信息学概念在二十世纪九十年代被提出,属于当前的一种新兴学科,其自身的实质是利用当前的信息科学、数理知识、理论观点以及其他内容等进行生命现象研究,进而明确生物学科自身的本质内涵,以满足当前实际的需求。例如,在研究生物遗传物质DNA时,灵活利用计算机,对其实际的序列、结构等相关内容进行整理,从根本上提升研究效率。

1计算机技术在生物信息学中的应用现状分析

生物信息学在研究过程中,受自身的数据信息逐渐增多影响,传统的研究逐渐难以记录与观察学科信息,需要灵活的应用计算机技术,促使学科研究合理高效,满足当前实际的需求。例如,计算机技术的应用,促使当前生物学科的检索、存储、查询、观察、处理等相关的研究过程高效,帮助研究人员对数据进行合理的分析,从大量的数据中找寻出生物信息学蕴藏的规律,并通过计算机进行合理的模拟,建立模型观察研究,加强对数据的分析,带动学科积极发展。现阶段,信息技术在生物信息学中的应用较为普遍,例如,人工智能技术、数据库、网络技术、平行计算技术以及生物计算等相关等等,促使现阶段的生物信息学突破现有的研究瓶颈,如,进行有效的模式识别,促使研究出现增长点,促使相关的领域知识逐渐分解简化,为人类的发展提供良好的基础。以实际的生物信息学DNA研究为基础,在研究时,可以灵活应用现阶段的计算机的图像处理技术,通过建立完善的三维模型,完成基因的测序工作,明确其中的核苷酸排列,促使三维结构清晰,为研究人员提供良好的研究方法、方向以及思路,促使学科发展。在发达的美国、日本、欧洲等地,利用计算机技术进行生物信息学研究更为先进,其技术已经逐渐成熟,而相对来说,虽然我国已经取得不俗的成绩,但与世界的先进水平仍存在一定的差距[1]。

2计算机技术在生物信息学中的应用是学科发展的必然

在当前的时代背景下,信息技术与计算机技术创新发展,逐渐涉及到人们生活中的各个方面,尤其是在生物信息学中的应用,促使该学科全面发展。相对来说,生物信息学的发展离不开计算机技术的支撑,只有以此为基础,为生物信息学的研究奠定良好的基础,才能保证其学科稳定的发展。从广阔的角度进行分析,网络技术与计算机技术是生物信息学稳定发展的前提,也是促使其符合现代要求的基础,例如,在二十世纪就是年代,美国提出高性能计算机与通信计划,其主要是指利用计算机自身的优势,保证生物信息学研究工作具有较高的性能,尤其是相对于生物信息学来说,该学科自身的性质较为特殊,研究的细胞或者其他内容数量较多,并且自身体积小,变化规律复杂,单凭人脑进行记忆与研究难以实现,而灵活应用计算机技术,可以从根本上提升研究速度,迎合时代的发展[2]。

3计算机技术在生物信息学中的应用分析

3.1可视化技术。可视化技术在生物信息学中应用的范围较广,尤其是针对结构研究时,可以帮助研究人员加深对结构的理解与分析,将其内容清晰的呈现。例如,在进行DNA研究过程中,DNA自身的分子空间螺旋结构单一的进行理论研究较为抽象,此时,可以灵活的应用计算机可视化技术,将DNA分解机构以视图的形式进行展示,并将其自身的蛋白质折叠结构、螺旋状、空间形状等进行显示,为研究人员提供良好的研究基础,加快研究效率,该可视化技术的应用属于最基本运用,而随着人们对生物信息学的研究程度逐渐加深,需要对现有的可视化技术进行创新,并促使其进一步深入,在DNA自身的基因突变研究、分子亲水研究、表面积研究以及相关的曲线变化研究等进行合理的可视化技术应用,满足实际的研究要求。例如,相对于生物信息学来说,其分子数据自身存在较为复杂的关系,其关系具有明显的关联性,受此特点影响,在研究过程中,主要将当前的可视化技术逐渐向信息关联方向发展,进而满足当前实际的需求。现阶段应用较为普遍的技术有信息壁显示技术,主要的作用是呈现出生物分子信息自身;语义镜技术,主要是指以当前实际的数据库技术为基础,对由多因素组合产生的生物现象进行呈现,将复杂的知识进行简单化;基因调控网络技术,主要是利用现阶段的网络技术对不同的数据进行有效的整理,在大量的数据中寻找出组合规律,进而促使研究人员向更深层次进行研究,明确生物信息学更复杂的关系与含义。3.2数据库技术。受生物信息学自身的性质影响,在不断的发展过程中,人们逐渐对生命现象自身的组成、发展、创新以及规律等进行更深层次的研究,导致其实研究数据呈爆炸增长的趋势,例如,在DNA的研究过程中,其组成部分核算与蛋白质分子数量较大,仅核苷酸的组成就包括三十多亿种组成,基于此,数据库技术的应用是生物信息学发展的必然。随着时代的不断发展,人们对于基因工程的研究不断深入,促使生物信息学信息数量庞大,呈现出爆炸增长的趋势,灵活应用数据库信息技术,可以将相关的信息进行合理的整理与分类,以便于人们进行有效的使用与参考。例如,建立良好的数据库,可以将DNA研究数据进行分类,分为蛋白质、核苷酸、结构等方面,如果数据较为庞大,则可以进行建立二级数据库,将其进行更细的划分,保证其合理性。现阶段,国际上对数据库技术在生物信息学中的应用较为先进,例如,细菌基因数据库、蛋白质结构数据库、人类基因数据库、糖类数据库、细胞数据库、免疫学数据库、植物基因数据库、以及真菌基因数据库等,几乎涵盖了生物信息学的所有领域,以此来满足当前时代的需求。以现阶段的北京大学的心血管研究所为例,在该研究所中,为提升研究效率,建立了完善的“基因与蛋白质数据库”,通过有效的信息整合,为实际的心虚管研究提供良好的研究基础与工具,研究人员可以随时参考资料,并通过对数据的分析与研究,迅速突破自身的研究瓶颈,满足实际的需求[3]。3.3人工智能技术。人工智能技术是现阶段应用较为普遍的技术,尤其是在当前的时代背景下,人们处于信息爆炸时代,并且为保证进行合理的研究,人们建立了大量的数据信息库,如何在数量庞大的信息中寻找到具有参考价值的信息是现阶段生物信息学研究人员必须关注的问题,进而在研究过程中发现某种规律,对生命现象进行合理的解释。灵活应用当前的人工智能技术,可以有效的帮助研究人员进行合理的数据分析,促使生物信息学科创新发展。例如,在不断的发展过程中,人们将基因识别算法逐渐进行创新,当前主要有三种:第一种,同源性方法、第二种,基于统计方法、第三种,基于机器学习方法,在实际的应用过程中,应用较为普遍的是第三种方法,主要是因为神经网络自身具有较强的非线性能力,可以从根本上对数据自身的相关性进行分析,保证分析效率与准确性。在实际的研究与分析过程中,受实际的生物信息学自身性质影响,也存在其他相关的方法,例如,隐马氏模型方法,在该方法研究过程中,可以合理的与其他相关方法进行结合,如,贝叶斯方法、神经网络语言方法等,被人们广泛的应用在生物序列分析中,并发挥出巨大的作用,进而满足当前实际的需求。人工智能技术与神经网络技术的应用,可以从根本上保证生物信息学有效的发展,突破现有的研究阻碍,满足时代的需求。

4结论

综上所述,在当前的时代背景下,计算机技术在生物学研究中的应用是时展的必然,可以帮助研究人员灵活运用先进的技术对知识内容进行分析,深入了解其内涵,并转变传统的研究观念与思想,促使生物信息学研究逐渐从量变到质变,从整体上提升我国生物科学研究水平。

参考文献

[1]罗文奇.计算机技术在生物信息学研究中的应用分析[J].中国管理信息化,2017,20(20):151-152.

[2]张敏辉,高晓玲.计算机技术在生物信息学中的应用研究[J].中国西部科技,2016,9(32):93-94.

生物信息学范文篇9

关键词:推荐系统;生物信息学

推荐系统(RecommenderSystem)[1]是个性化信息服务的主要技术之一,它实现的是“信息找人,按需服务”;通过对用户信息需要、兴趣爱好和访问历史等的收集分析,建立用户模型,并将用户模型应用于网上信息的过滤和排序,从而为用户提供感兴趣的资源和信息。生物信息学(Bioinformatics)[2,3]是由生物学、应用数学和计算机科学相互交叉所形成的一门新型学科;其实质是利用信息科学的方法和技术来解决生物学问题。20世纪末生物信息学迅速发展,在信息的数量和质量上都极大地丰富了生物科学的数据资源,而数据资源的急剧膨胀需要寻求一种科学而有力的工具来组织它们,基于生物信息学的二次数据库[4]能比较好地规范生物数据的分类与组织,但是用户无法从大量的生物数据中寻求自己感兴趣的部分(著名的生物信息学网站NCBI(美国国立生物技术信息中心),仅仅是小孢子虫(Microsporidia)的DNA序列就达3399种),因此在生物二次数据库上建立个性化推荐系统,能使用户快速找到自己感兴趣的生物信息。特别是在当前生物信息数据量急剧增长的情况下,生物信息学推荐系统将发挥强大的优势。

1推荐系统的工作流程

应用在不同领域的推荐系统,其体系结构也不完全相同。一般而言,推荐系统的工作流程[5]如图1所示。

(1)信息获取。推荐系统工作的基础是用户信息。用户信息包括用户输入的关键词、项目的有关属性、用户对项目的文本评价或等级评价及用户的行为特征等,所有这些信息均可以作为形成推荐的依据。信息获取有两种类型[6],即显式获取(Explicit)和隐式获取(Implicit),由于用户的很多行为都能暗示用户的喜好,因此隐式获取信息的准确性比显式高一些。

(2)信息处理。信息获取阶段所获得的用户信息,一般根据推荐技术的不同对信息进行相应的处理。用户信息的存储格式中用得最多的是基于数值的矩阵格式,最常用的是用m×n维的用户—项目矩阵R来表示,矩阵中的每个元素Rij=第i个用户对第j个项目的评价,可以当做数值处理,矩阵R被称为用户—项目矩阵。

(3)个性化推荐。根据形成推荐的方法的不同可以分为三种,即基于规则的系统、基于内容过滤的系统和协同过滤系统。基于规则的推荐系统和基于内容过滤的推荐系统均只能为用户推荐过去喜欢的项目和相似的项目,并不能推荐用户潜在感兴趣的项目。而协同过滤系统能推荐出用户近邻所喜欢的项目,通过用户与近邻之间的“交流”,发现用户潜在的兴趣。因此本文所用的算法是基于协同过滤的推荐算法。

(4)推荐结果。显示的任务是把推荐算法生成的推荐显示给用户,完成对用户的推荐。目前最常用的推荐可视化方法是Top-N列表[7],按照从大到小顺序把推荐分值最高的N个事物或者最权威的N条评价以列表的形式显示给用户。

2生物信息学推荐系统的设计

综合各种推荐技术的性能与优缺点,本文构造的生物信息学推荐系统的总体结构如图2所示。

生物信息学推荐系统实现的主要功能是在用户登录生物信息学网站时,所留下的登录信息通过网站传递到推荐算法部分;推荐算法根据该用户的用户名从数据库提取出推荐列表,并返回到网站的用户界面;用户访问的记录返回到数据库,系统定时调用推荐算法,对数据库中用户访问信息的数据进行分析计算,形成推荐列表。

本系统采用基于近邻的协同过滤推荐算法,其结构可以进一步细化为如图3所示。算法分为邻居形成和推荐形成两大部分,两部分可以独立进行。这是该推荐系统有别于其他系统的优势之一。由于信息获取后的用户—项目矩阵维数较大,使得系统的可扩展性降低。本系统采用SVD矩阵降维方法,减少用户—项目矩阵的维数,在计算用户相似度时大大降低了运算的次数,提高了推荐算法的效率。

(1)信息获取。用户对项目的评价是基于用户对某一个项目(为表示简单,以下提及的项目均指网站上的生物物种)的点击次数来衡量的。当一个用户注册并填写好个人情况以后,系统会自动为该用户创建一个“信息矩阵”,该矩阵保存了所有项目的ID号以及相应的用户评价,保存的格式为:S+编号+用户评价,S用于标记项目,每个项目编号及其评价都以“S”相隔开;编号是唯一的,占5位;用户评价是用户点击该项目的次数,规定其范围是0~100,系统设定当增加到100时不再变化。这样做可防止形成矩阵时矩阵评价相差值过大而使推荐结果不准确。(2)信息处理。信息处理是将所有用户的信息矩阵转换为用户—项目矩阵,使用户信息矩阵数值化,假设系统中有M个用户和N个项目,信息处理的目的就是创建一个M×N的矩阵R,R[I][J]代表用户I对项目J的评价。

(3)矩阵处理。协同过滤技术的用户—项目矩阵的数据表述方法所带来的稀疏性严重制约了推荐效果,而且在系统较大的情况下,它既不能精确地产生推荐集,又忽视了数据之间潜在的关系,发现不了用户潜在的兴趣,而且庞大的矩阵增加了计算的复杂度,因此有必要对该矩阵的表述方式做优化,进行矩阵处理。维数简化是一种较好的方法,本文提出的算法应用单值分解(SingularValueDecomposition,SVD)技术[8],对用户—项目矩阵进行维数简化。

(4)相似度计算。得到降维以后的用户矩阵US,就可以寻找每个用户的近邻。近邻的确定是通过两个用户的相似度来度量的。本文采用Pearson相关度因子[9]求相似度。(5)计算用户邻居。该方法有两种[10],即基于中心的邻居(Center-BasedNeighbor)和集合邻居(AggregateNeighbor)。本系统采用了第一种方法,直接找出与用户相似度最高的前N个用户作为邻居,邻居个数N由系统设定,比如规定N=5。

(6)推荐形成。推荐形成的前提是把当前用户的邻居ID号及其与当前用户的相似度保存到数据库中,而在前面的工作中已找出各用户的邻居以及与用户的相似度,推荐形成部分只需要对当前登录用户进行计算。推荐策略是:对当前用户已经访问过的项目不再进行推荐,推荐的范围是用户没有访问的项目,其目的是推荐用户潜在感兴趣的项目;考虑到系统的项目比较多,用户交互项目的数量很大,所以只筛选出推荐度最大的N个项目,形成Top-N推荐集,设定N=5。

3生物信息学推荐系统的实现

生物信息学推荐系统的实现可以用图4来表示。数据库部分主要存储用户信息和项目信息,用SQLServer2000实现。

数据访问层实现了与用户交互必需的存储过程以及触发器,也使用SQLServer2000,主要完成以下功能:初始化新用户信息矩阵;插入新项目时更新所有用户的信息矩阵;用户点击项目时更新该用户对项目的评价;删除项目时更新所有用户的信息矩阵。用户访问层主要涉及网页与用户的交互和调用数据访问层的存储过程,在这里不做详细的介绍。

推荐算法完成整个个性化推荐的任务,用Java实现。(1)数据连接类DataCon。该类完成与SQLServer2000数据库的连接,在连接之前必须要下载三个与SQLServer连接相关的包,即msutil.jar、msbase.jar和mssqlserver.jar。

(2)数据操作类DataControl。该类负责推荐算法与数据库的数据交换,静态成员Con调用DataCon.getcon()获得数据库连接,然后对数据库进行各种操作。把所有方法编写成静态,便于推荐算法中不创建对象就可以直接调用。

(3)RecmmendSource与CurrentUserNeighbor。这两个类作为FCRecommand类的内部类,RecmmendSource用于保存当前用户的推荐列表,包括推荐项目号和推荐度;CurrentUserNeighbor用于保存邻居信息,包括邻居ID号、相似度及其访问信息。

(4)协同过滤推荐算法FCRecommand。该类实现了整个推荐算法,主要分为邻居形成方法FCArithmetic和推荐形成方法GenerateRecommend。

下面给出方法FCArithmetic的关键代码:

Matrixuser_item=this.User_Item_Arry();//获取用户—项目矩阵

user_item=this.SVD_Calculate(user_item);//调用SVD降维方法

Vectorc_uservector=newVector();//当前用户向量

Vectoro_uservector=newVector();//其他用户向量

Vectorc_user_correlate_vector=newVector();

//当前用户与其他用户之间相似度向量

for(inti=0;ifor(intj=0;jc_uservector.addElement(user_item.get(i,j));

//1.获得当前用户向量

for(intk=0;ko_uservector.clear();

for(intl=0;lo_uservector.addElement(user_item.get(k,l));

//2.获得其他用户的向量

//3.计算当前用户与其他用户的相似度

usercorrelativity=this.Correlativity(c_uservector,o_uservector);

c_user_correlate_vector.addElement(usercorrelativity);

}

//4.根据当前用户与其他用户的相似度,计算其邻居

this.FindUserNeighbor(i,c_user_correlate_vector);

}

根据邻居形成方法FCArithmetic,可以得到每个用户的邻居。作为测试用例,图6显示用户Jack与系统中一部分用户的相似度,可以看出它与自己的相似度必定最高;并且它与用户Sugx访问了相同的项目,它们之间的相似度也为1,具有极高的相似度。

4结束语

在传统推荐系统的基础上,结合当前生物信息学网站的特点,提出一个基于生物信息平台的推荐系统,解决了传统生物信息网站平台信息迷茫的缺点,为用户推荐其感兴趣物种的DNA或蛋白质序列。

优点在于协同过滤的推荐算法能发现用户潜在的兴趣,能促进生物学家之间的交流;推荐算法的邻居形成与推荐形成两部分可以单独运行,减少了系统的开销。进一步的工作是分析生物数据的特点及生物数据之间的关系,增加用户和项目数量,更好地发挥推荐系统的优势。

参考文献:

[1]PAULR,HALRV.Recommendersystems[J].CommunicationsoftheACM,1997,40(3):56-58.

[2]陈新.生物信息学简介[EB/OL].(2001).166.111.68.168/bioinfo/papers/Chen_Xin.pdf.

[3]林毅申,林丕源.基于WebServices的生物信息解决方案[J].计算机应用研究,2005,22(6):157-158,164.[4]邢仲璟,林丕源,林毅申.基于Bioperl的生物二次数据库建立及应用[J].计算机系统应用,2004(11):58-60.

[5]AIRIAS,TAKAHISAA,HIROYAI,etal.Personalizationsystembasedondynamiclearning:InternationalSemanticWebConference[C].Sardinia:[s.n.],2002.

[6]BREESEJS,HECKERMAND,KADIEC.Empericalanalysisofpredictivealgorithmsforcollaborativefiltering:proceedingsoftheFourteenthConferenceonUniversityinArtificialIntelligence[C].Madison:WI,1998:43-52.

[7]SCHAFERJB,KONSTANJ,RIEDLJ.Recommendersystemsine-commerce:proceedingoftheACMConferenceonElectronicCommerce[C].Pittsburgh:PA,1999:158-166.

[8]PRYORMH.Theeffectsofsingularvaluedecompositiononcollaborativefiltering[EB/OL].(1998).www.cs.dartmouth.edu/reports/TR98-338.pdf.

生物信息学范文篇10

关键词:医学检验;生物信息学;课程教学

近年来,生物信息学在各医药院校越来越受到重视,多所院校相继在研究生教学中开设了生物信息学课程[1]。而对于医学本科层次是否需要开设生物信息学课程这一问题,虽然目前各方面的观点不一,但是已经有一些院校开始进行尝试。目前医学检验专业(五年制,毕业时授予医学学士学位)已调整为医学检验技术专业(四年制,毕业时授予理学学士学位),而生物信息学作为一门新课程,在医学检验(技术)专业学生培养中的作用正日益受到关注,逐步被某些院校选择作为必修课或者选修课。

一、开设课程的必要性

空前繁荣的生物医学大数据的产出,及其蕴含的重大生命奥秘的揭示,将决定现代生命科技和医药产业研发的高度,决定人们对疾病的认识和掌控能力,也将对主导生物医学大数据存储、管理、注释、分析全过程,解决生命密码的关键手段———现代生物信息学技术的发展带来前所未有的机遇和挑战[2]。对于医学专业学生而言,通过学习生物信息学,从而掌握利用各种网络信息资源来检索和获取生物信息数据,并选择和使用各种生物信息学软件来分析数据。在当今大数据时代,这方面的知识和技能的培养对于医学生今后从事医学科研工作是非常重要的。因此,在医学专业学生中开设生物信息学课程非常必要。我校从2010年开始将生物信息学设置为研究生教学的必修课;从2013年开始在医学检验专业中开设生物信息学选修课,自2015年开始转为医学检验技术专业。在医学检验技术专业中开设生物信息学课程,能够为该专业学生的临床和科研方面的素质积累提供必要的支持,更重要的是增强了在医学和信息科学交叉领域解决问题的技能,其意义几乎等同于在研究生教学中的设课意义。

二、教学内容的安排

医学检验技术专业的教学任务非常紧张,几乎将原来医学检验专业前八个学期(最后两个学期为实习阶段)课程压缩到六个学期来完成,学生学习压力可想而知。我校为了减轻学生负担,各课程的课时数都比医学检验专业有所减少。但生物信息学并未改变,仍然为16学时。为了在较短的学时内实现教学效果的最大化,我们结合该专业学生的特点和需求,将授课内容分为理论课和实践课两部分,实践课不占学时。理论课主要介绍基本的生物信息学理论、资源和数据的获取、分析方法和工具的使用;实践课则通过布置作业,课后上机操作来解决问题。理论课主要内容包括:生物信息学导论、DNA测序技术、序列的获取、双序列比对、多序列比对、蛋白质结构分析和预测共计六个专题。实践课主要内容包括:cDNA及基因组参考序列的获取;常见序列格式的释义与转换;双序列比对(局部比对);多序列比对(全局比对);蛋白质综合信息查询;蛋白质基本性质、疏水区、亚细胞定位、信号肽、跨膜区、模体及结构域分析与二级结构预测;蛋白质三级结构预测。在理论课实施过程中,注重将与生物信息学相关的生命科学和医学前沿的一些最新进展和最新成果引入理论知识讲授中,让学生在有限学时内能够进一步认识生物信息学的内涵和课程的价值,追踪前沿学科的动态,开拓视野。

三、教学方法的设计

生物信息学涉及多个学科领域,交叉性强,在较短的学时内学好这门课程的难度很大。学生的学习兴趣与教学内容和手段关系密切,除了精心选择教学内容外,教学方法上也有很多需要革新乃至创新的地方。在教学过程中,我们形成了颇具特色的教学经验,由授课教师独创的授课———实践———演示(Teaching-Practicing-Showing,TPS)教学模式已应用于教学。TPS教学模式着力于以实际问题为引线,将理论授课与上机实践有机地融为一体,逐步介绍生物数据分析的各项技能,并指导学生将其融会贯通以真正掌握相关的基本方法与常用工具。首先,在教学内容上引入具体实例来进行教学,比如讲解生物信息数据库(Gene、Nucleotide、UniProt、PDB等)时,通过给出检索某个人类疾病基因数据的例子来学习数据库的使用方法。课堂上教学实例的设计需要任课教师在备课时投入大量精力来完成,还需要教师具备多学科交叉的知识。教学实践表明,与医学相关的生物信息学分析实例可以让学生更好地认识该课程的作用,大幅度提高学生的学习兴趣和学习的主动性。此外,课堂教学手段也应该丰富多彩,多媒体教学中可以充分使用图片、动画等元素。其次,举例分析时可以进行一定的现场演示,比如讲解检索Unigene数据库时可以一边上网演示一边解释说明。

四、考核方式的变革

生物信息学作为选修课,既要遵循学校相关的考试制度,也要通过对考试方式的变革来提高考试效果。我们将理论考核与学生的实践能力考核联系起来,结合学生课外实践任务的完成情况和开卷考试成绩进行综合评定。在课程中安排一次课外实践任务,要求每位学生独立完成相关分析并提交书面分析报告,该部分占考核成绩的20%。具体内容为自行选择一个人类细胞外功能蛋白:1.利用ClustalX对各物种参考蛋白序列进行多序列比对(输出PS格式结果);2.分析分子量、等电点、分子式、稳定性、亲疏水性及亚细胞定位;3.预测二级结构并模拟三维结构。课程结束后进行开卷考试,内容包括基础知识和综合分析,尽量采取灵活的出题方式,并控制题量,该部分占考核成绩的80%。近年来的教学实践表明,这种综合评定的方式能够反映学生对该课程的掌握程度,体现学生利用生物信息学知识解决问题的能力。

五、展望

实践表明,生物信息学课程教学能够给学生提供所需要的生物信息学知识和技能,但是在教学内容安排、教学方法设计、教学手段使用和教学效果评价等诸多环节都需要进一步探讨。在这个过程中,我们既需要吸收传统教学模式中的优点和精髓,做到严谨和切合实际,又需要更新教学理念,突出医学特色,大胆尝试新的教学方法和手段,最终形成本课程别具一格的教学特色。

作者:伦永志 单位:大连大学

参考文献