第1章 醫(yī)學發(fā)展與數據科學 1
1.1?醫(yī)學認知的物質化、科學化和數據化 1
1.1.1?從神靈主義走出的醫(yī)學? 1
1.1.2?醫(yī)學認知的物質化? 2
1.1.3?醫(yī)學認知的科學化? 4
1.1.4?醫(yī)學認知的數據化? 6
1.2?數據化或是傳統(tǒng)醫(yī)學現代化的必經之路 8
1.2.1?現代醫(yī)學與傳統(tǒng)醫(yī)學的分歧? 8
1.2.2?數據科學助力傳統(tǒng)醫(yī)學融入現代? 8
1.3?以實踐和數據說話的循證醫(yī)學發(fā)展歷程 10
1.3.1?理解循證醫(yī)學? 10
1.3.2?循證醫(yī)學證據體系建立的五個階段? 11
1.4?基于PICOS原則把臨床語言轉變?yōu)閿祿Z言 18
1.5?數據科學在循證醫(yī)學證據體系以外的應用 19
第2章 走進數據科學時代 23
2.1?大數據的由來、定義和特征 23
2.1.1?大數據的由來和定義? 23
2.1.2?大數據的nV特征? 24
2.1.3?走出數據以“大”論英雄的誤區(qū)? 25
2.2?大數據發(fā)展的數據工程問題 27
2.2.1?硬件工程問題? 27
2.2.2?軟件技術問題? 28
2.3?大數據發(fā)展的數據科學問題 30
2.3.1?統(tǒng)計學的由來與發(fā)展? 30
2.3.2?智能的內涵:知有所合謂之智,能有所合謂之能? 31
2.3.3?人工智能的起落與輝煌? 32
2.3.4?發(fā)展人工智能應堅守的造物觀:重己役物,致用利人? 35
2.4?大數據驅動的數據科學生態(tài)變革 38
2.4.1?從統(tǒng)計學思維到應用型思維? 38
2.4.2?數據科學生態(tài)促使數據從業(yè)者角色分化? 40
2.5?大數據驅動的科學研究范式變革 42
2.5.1?科學革命的結構? 42
2.5.2?第四范式與AI for science? 43
2.6?大數據驅動的日常生活變革 46
2.7?數字經濟驅動數據要素價值變現 48
2.7.1?互聯(lián)網泡沫破碎后的數字經濟重建? 48
2.7.2?理解數據要素化? 49
2.7.3?數據變現的路徑? 51
第3章 健康醫(yī)療大數據與人工智能 54
3.1?健康醫(yī)療大數據的范圍 54
3.2?健康醫(yī)療大數據的行業(yè)特征 55
3.2.1?醫(yī)療大數據的縱向和橫向孤島現象? 55
3.2.2?健康醫(yī)療大數據的多模態(tài)性、疾病主題特異性和動態(tài)性? 56
3.2.3?健康醫(yī)療大數據的主觀性和價值稀疏性? 56
3.3?大數據驅動的人工智能在醫(yī)療領域的應用與角色 59
3.3.1?人工智能在醫(yī)療領域的應用? 59
3.3.2?從效率工具角度看待醫(yī)療人工智能? 61
3.3.3?醫(yī)療AI開發(fā)中的困難與瓶頸? 62
3.4?模型的透明性和可問責性是醫(yī)療人工智能廣泛落地的基礎 64
第4章 健康醫(yī)療大數據讓循證醫(yī)學走進真實世界 67
4.1?以RCT為代表的理想世界研究的局限性 67
4.2?基于真實世界數據的真實世界研究 69
4.2.1?真實世界研究的定義? 69
4.2.2?真實世界研究的證據等級體系? 72
4.3?大數據時代下的真實世界人群隊列管理 74
第5章 基于真實世界數據的醫(yī)學統(tǒng)計 76
5.1?醫(yī)療業(yè)務的數據化 76
5.2?缺失值的識別和處理 78
5.3?真實世界研究數據分析要點概述 80
5.4?統(tǒng)計三件套:說一說、比一比、找關系 84
5.5?從暴露到結局的單變量關系是經典循證醫(yī)學研究的基本關注點 90
5.5.1?單變量之間的線性和廣義線性關系? 90
5.5.2?單變量之間的線性趨勢關系和非線性關系? 98
5.5.3?從辛普森悖論看為什么研究單變量之間的關系同樣要做多
因素分析? 101
5.5.4?單變量間的相關關系和因果關系? 104
5.6?單變量之間關系的論證邏輯結構 105
5.6.1?從定性到定量:單變量關系研究需要回答的四個問題? 105
5.6.2?從一根杠桿看懂何為混雜和交互因素? 106
5.6.3?混雜因素的識別和控制? 108
5.6.4?交互因素的識別和控制? 112
5.6.5?傾向性評分:控制多個混雜的神器? 113
第6章 由統(tǒng)計推導結論到智能預測 119
6.1?從醫(yī)學統(tǒng)計到統(tǒng)計學習 119
6.1.1?從效用統(tǒng)計到結局預測? 119
6.1.2?從人工智能到機器學習? 120
6.1.3?人工智能中的損失和優(yōu)化? 123
6.2?臨床預測模型構建的基本思路 125
6.2.1?建模前工作? 125
6.2.2?建模中工作? 127
6.2.3?建模后工作? 129
6.3?醫(yī)療機器學習的“PICOS” 140
第7章 統(tǒng)計學習的常見算法淺析 142
7.1?回歸分析中的多重共線性與Lasso回歸 142
7.1.1?多重共線性的影響和識別? 142
7.1.2?Lasso回歸的原理? 143
7.2?通俗好用的樹模型和集成算法 146
7.2.1?用于分類任務的決策樹構建? 146
7.2.2?用于回歸任務的回歸樹和模型樹? 151
7.2.3?群策群力的集成學習? 152
7.3?人們日用而不自知的貝葉斯推理 155
7.3.1?初識貝葉斯定理? 155
7.3.2?樸素貝葉斯算法? 158
7.3.3?概率圖模型? 159
7.4?基于距離的機器學習分類與聚類 161
7.4.1?K近鄰分類? 162
7.4.2?聚類算法? 163
7.5?數據降維的藝術 166
7.5.1?主成分分析? 166
7.5.2?因子分析? 174
7.6?支持向量機 178
7.6.1?AI界的水果忍者? 178
7.6.2?SVM到底在優(yōu)化什么?? 180
7.6.3?核技巧是使SVM真正強大起來的原因? 183
7.7?挖掘數據共顯模式的關聯(lián)規(guī)則算法 185
7.7.1?驅動購物的關聯(lián)規(guī)則? 185
7.7.2?Apriori算法? 186
7.8?時間序列分析 188
第8章 開啟多模態(tài)學習的深度學習 201
8.1?人工神經網絡與深度學習 201
8.1.1?人工神經網絡與深度學習入門? 201
8.1.2?神經網絡在學習過程中,到底學到了什么?? 204
8.1.3?如何更準確地選擇損失函數下降的方向? 208
8.2?卷積神經網絡與機器視覺 211
8.2.1?卷積神經網絡的直觀理解? 211
8.2.2?卷積運算的數學解釋? 214
8.2.3?計算機視覺和卷積神經網絡的發(fā)展脈絡? 217
8.2.4?醫(yī)學影像人工智能? 222
8.3?給AI植入想象力的對抗生成網絡和擴散模型 227
8.3.1?對GAN原理的形象理解? 227
8.3.2?GAN訓練過程的算法數學理解? 228
8.3.3?GAN的其他集中花式玩法? 230
8.3.4?擴散模型簡介? 233
8.4?使AI學會策略的強化學習 235
8.4.1?理解決策過程? 235
8.4.2?如何學習Q值?? 236
8.4.3?理解整個策略學習過程? 236
8.4.4?理解深度強化學習之DQN? 238
8.5?循環(huán)神經網絡與自然語言處理 240
8.5.1?對RNN的形象理解? 240
8.5.2?對RNN的算法理解? 241
8.6?基于深度學習的自然語言處理簡介 245
8.6.1?詞的向量表示? 245
8.6.2?Encoder-Decoder和注意力機制? 250
8.6.3?從transformer到ChatGPT? 253
8.6.4?自然語言處理在醫(yī)學中的應用淺析? 261
8.7?大模型驅動的AIGC通用人工智能時代 263
8.7.1?AIGC緣起? 263
8.7.2?大力出奇跡:ChatGPT引爆了AIGC的奇點? 264
8.7.3?大模型的解封咒語:提示工程? 269
第9章 日常診療與數據科學 271
9.1?臨床推理中的雙重認知模式 271
9.2?醫(yī)療與數據科學的認知協(xié)同 275
9.3?人機決策與CDSS 278
9.4?醫(yī)療從業(yè)者學習數據科學的必要性和可行性 281
第10章 精準醫(yī)學與數據科學 284
10.1?精準醫(yī)學的由來 284
10.2?精準醫(yī)學與組學研究 285
10.3?以中心法則為主線開展的組學研究 286
10.4?中心法則之外,拓寬組學的邊界 291
10.5?始于差異,經由機制,終于臨床 293
第十一章 醫(yī)藥研發(fā)與數據科學 301
11.1?新藥研發(fā)概述 301
11.2?生物分子的化學表征與計算 302
11.3?基于不同分子表征的模型計算 304
第12章 轉化醫(yī)學與數據科學 307
12.1?轉化醫(yī)學的由來、階段和與數據科學的關系 307
12.2?樹立合理的醫(yī)學科技創(chuàng)新觀念和轉化動機 310
12.3?科技成果評價的主要方法和維度 314
12.4?醫(yī)學科技成果的轉化途徑與過程 325
12.5?醫(yī)學轉化案例之CRISPR-Cas9基因編輯技術 330
第13章 智慧健康醫(yī)療與數據科學 333
13.1?智慧健康醫(yī)療概述 333
13.2?智慧健康醫(yī)療衍射出的重要概念 340
13.3?數據科學之于智慧醫(yī)療,是漁而非魚 345
第14章 合理醫(yī)療與數據科學 351
14.1?合理醫(yī)療的大道理 351
14.2?不合理醫(yī)療的小算盤 352
14.3?合理醫(yī)療監(jiān)管的外儒內法 359
14.4?監(jiān)管手段從形式之法到數據之法 361
14.5?基于數據科學的合理醫(yī)療循證評價 364
第15章 醫(yī)院管理與數據科學 370
15.1?指標化的醫(yī)院數字化管理 370
15.2?基于數據科學的DRGs/DIP醫(yī)保費用管理 379
15.3?基于數據科學方法的精細醫(yī)院運營管理 386
15.4?基于數據科學的RBRVS績效評價體系構建 391
第16章 醫(yī)學人文與數據科學 396
16.1?技術和人文是醫(yī)學發(fā)展的雙翼 396
16.2?數據科學對醫(yī)學人文的潛在影響 400
16.3?在醫(yī)學美學的指導下發(fā)展醫(yī)療數據科學 403
第17章 醫(yī)療大數據的理、采、存、管、用 407
17.1?醫(yī)療機構數據應用的窘境 407
17.2?醫(yī)療大數據平臺的四層架構和五項功能 412
17.3?醫(yī)療大數據的變現管理 421
17.4?醫(yī)療大數據應用的安全體系 426
17.4.1?信息安全是所有數據建設的基礎? 427
17.4.2?健康醫(yī)療大數據的合規(guī)管理? 431
17.4.3?隱私計算在促進醫(yī)療大數據合規(guī)應用的作用? 437
17.4.4?隱私計算融合區(qū)塊鏈提升數據協(xié)作全流程保護能力? 441
17.4.5?易被忽視的AI安全? 442
17.5?DataOps推動業(yè)務數據協(xié)作聯(lián)動? 445
17.6?警惕唯數據主義的陷阱 447
后?記 精數道以明醫(yī)理,通仁術以踐仁心 453