《数据学》


朱扬勇, 熊赟. 复旦大学出版社. 2009年12月, 第1版.


    本书介绍了数据学的由来、基本概念和基本原理,包括:数据大爆炸、数据自然界、数据学基础;介绍了数据学的主要方法,包括:数据勘探、数据获取与整合、数据挖掘、数据实验;还介绍了数据学的应用和数据学面临的挑战。

    本书主要作为科学研究工作者的参考书,试图向科学工作者展示一种新的科学,并且能够利用这种新的科学为当前的科学研究工作服务。本书基本以较为通俗化的语言来表达数据学的基本原理、方法和技术,希望对各领域的科学家,包括行为科学家和社会科学家能够有所启迪。




《生物数据整合和挖掘》


朱扬勇, 熊赟. 复旦大学出版社. 2009年5月, 第1版.


    生物信息学应用计算机技术对各种生物数据进行管理和分析,以期发现生物数据所反映的生物规律,促进生命科学的发展。一方面,生命科学实验产生的巨量的生物数据保存在世界各地的相关研究机构中,或隐含在浩瀚的科学文献里。这些数据反映了生命科学研究的整体进展和成果,有重叠更相互补充,这就需要将这些生物数据整合在一起。另一方面,生物信息学也希望采用数据挖掘技术对生物数据进行分析,以期发现生物规律,因此根据生命科学的需要和领域知识,设计出有效的生物数据挖掘算法和软件工具是一个重要的研究内容。

    本书较为系统地介绍了生物数据整合与挖掘的技术框架,主要介绍了作者在这方面的研究成果,包括:生物数据抽取技术、生物数据整合技术、生物序列数据挖掘、基因表达谱芯片数据挖掘、转录因子及顺式调控元件挖掘、生物数据模型和数据库管理系统等内容,还介绍了一个生物数据整合系统、一个基因表达谱芯片数据库和数据挖掘系统、一个转录因子及顺式调控元件的挖掘分析平台等等的设计与实现。

    本书的读者对象为从事生物信息学研究的科学工作者。本书也可以作为生物信息学专业研究生的教学参考书和生物软件工程技术人员的参考书。