本书以数据挖掘与模式识别的七大原理在临床医学中的运用案例为切入点,系统而全面地介绍了医学数据挖掘的基本方法与原理,对数据分析的常用算法进行了通俗易懂的讲解。本书最大的特色是采用了案例分析与实证的方法,每一个原理、算法都在案例讲解中生动地体现出来。更重要的是,本书对临床医学的数据挖掘与模式识别技术进行了开创性、系统性的讨论,用案例展现了数据挖掘技术如何与临床医学相结合,为广大的医生、医学数据挖掘爱好者提供了很实用的技术示范、理念导入、系统思考。
本书所有概念的讲解基本结构为原理讲解与案例实操的二元结构,兼顾初学者与专业人士的需要。本书重点探讨了数据挖掘技术如何与临床医学深度融合,如何运用现代的数据挖掘理念、模式识别与机器学习的基本方法解决临床科研中的应用问题,为广大的科研型临床医生提供助力,为广大的数据分析人员找到行业应用的范例,为广大初学者提供努力学习的方向,更重要的是在这个大数据时代,我们可以亲自见证数据技术是如何改变并深刻影响着临床医学的科研与教学。
采用大量案例与实证,重点探讨数据挖掘技术如何与临床医学深度融合
序
Big Data(大数据)在这几年突然火红于日常生活的各项领域中,连临床医疗也不例外,其实早期就存在许多通过数据来佐证或者分析预测结果的例子,但是当时在大多数的情况之下,统计运算不够快速成为了资料分析的一大限制,因此大多数资料是被临床研究工作者们放在一边而从未思考该如何运用的。伴随着信息科技的进步以及发达,能为我们所分析的数据将呈现爆炸性的成长,因此人们能从数据中学习的知识会更加丰富。和其他科学领域相比,需要透过大量临床试验的医学领域算是进步较缓慢的学科。管仲曾说过:“不明于数欲举大事,如舟之无楫而欲行于大海也。”意思是说在不清楚相关数据的情况下想做大事,无疑是没有桨的船想航行于汪洋大海中一样。也就是说,在医疗大数据的时代下,“dry lab”的医疗数据研究将会是协助医学领域快速进步的一大重要关键。本书通过大量临床医学的实例,由浅入深地介绍各项数据分析以及数据挖掘的方法和工具,将大量的临床医学数据化繁为简。相信无论是在校的学生或是临床研究者,本书都将会是学习或科研路上不可或缺的好伙伴。
谢邦昌
台北医学大学管理学院及大数据研究中心 院长/主任
中华市场研究协会理事长
中华资料采矿协会荣誉理事长
前 言
在医学大数据时代,数据技术带来了临床医学科研的革命性进步。本书通过对医疗数据挖掘的基本理论的阐述,将现代统计学与数据挖掘技术有机结合,讲述了大量的医学数据挖掘的案例,提供了大量的医学数据挖掘的实操方法。医学数据模式识别的七大原理与案例讲解是本书具有独创性的对医学数据技术的全面概括与总结,七大原理的首次提出也是医学数据挖掘技术上升到系统理论的重要实践与创新。无论是预测性建模、解释性建模、知识性建模与描述性建模,抑或是序列模式建模、依赖关系建模、异常模式建模,模式识别的类型规律跃然纸上,为专业人士或初学者厘清了数据挖掘与模式识别的基本类型特征。
不仅如此,本书选取的大量的医学数据挖掘案例为本书的实用性增加了学以致用的特色,凡认真阅读本书的读者都会从理论与实操两个层面全面、系统、实用地了解医学数据挖掘的原理与方法。本书以胰腺癌与二型糖尿病的关联规则、乳腺癌图片智能识别的挖掘算法、心电信号大数据的人工智能识别、低位前切保肛术的荟萃分析、贝叶斯网络预测高血压患者心血管风险、基线静息心率评估心血管事件、老年肺癌研究的荟萃分析等实用数据技术为切入点,使初学者能够掌握医学数据挖掘的基本理论与方法,因此是一本很好的入门级教科书。
对于资深的临床医生、医学博士、论文写作者而言,本书也是一本很好的案例参考书。特别是对于医学科研课题而言,本书提供了强大的实际操作技术培训与案例讲解,从顶级的国际期刊《自然》、《细胞》、《柳叶刀》等杂志选取经典的数据分析案例,用生动的方法让读者可以学到医学论文中数据、图表、算法的实际使用方法;因而对于专业人员而言,本书又是一本很好的资深级别的专业用书。
我们相信,无论您是初学者还是资深的专业人士,本书都将为您提供极大的可读性、趣味性和科学性。