書????名 | 精通特征工程 | 作????者 | [美]愛麗絲·鄭、阿曼達(dá)·卡薩麗 |
---|---|---|---|
ISBN | 9787115509680 | 頁????數(shù) | 156頁 |
定????價(jià) | 59元 | 出版社 | 人民郵電出版社 |
出版時(shí)間 | 2020年3月 | 裝????幀 | 平裝 |
開????本 | 16開 |
前言 ix
第 1 章 機(jī)器學(xué)習(xí)流程 1
1.1 數(shù)據(jù) 1
1.2 任務(wù) 1
1.3 模型 2
1.4 特征 3
1.5 模型評(píng)價(jià) 3
第 2 章 簡單而又奇妙的數(shù)值 4
2.1 標(biāo)量、向量和空間 5
2.2 處理計(jì)數(shù) 7
2.2.1 二值化 7
2.2.2 區(qū)間量化(分箱) 9
2.3 對(duì)數(shù)變換 13
2.3.1 對(duì)數(shù)變換實(shí)戰(zhàn) 16
2.3.2 指數(shù)變換:對(duì)數(shù)變換的推廣 19
2.4 特征縮放/ 歸一化 24
2.4.1 min-max 縮放 24
2.4.2 特征標(biāo)準(zhǔn)化/ 方差縮放 24
2.4.3 2
歸一化 25
2.5 交互特征 28
2.6 特征選擇 30
2.7 小結(jié) 31
2.8 參考文獻(xiàn) 32
第3 章 文本數(shù)據(jù):扁平化、過濾和分塊 33
3.1 元素袋:將自然文本轉(zhuǎn)換為扁平向量 34
3.1.1 詞袋 34
3.1.2 n 元詞袋 37
3.2 使用過濾獲取清潔特征 39
3.2.1 停用詞 39
3.2.2 基于頻率的過濾 40
3.2.3 詞干提取 42
3.3 意義的單位:從單詞、n 元詞到短語 43
3.3.1 解析與分詞 43
3.3.2 通過搭配提取進(jìn)行短語檢測 44
3.4 小結(jié) 50
3.5 參考文獻(xiàn) 51
第4 章 特征縮放的效果:從詞袋到tf-idf 52
4.1 tf-idf:詞袋的一種簡單擴(kuò)展 52
4.2 tf-idf 方法測試 54
4.2.1 創(chuàng)建分類數(shù)據(jù)集 55
4.2.2 使用tf-idf 變換來縮放詞袋 56
4.2.3 使用邏輯回歸進(jìn)行分類 57
4.2.4 使用正則化對(duì)邏輯回歸進(jìn)行調(diào)優(yōu) 58
4.3 深入研究:發(fā)生了什么 62
4.4 小結(jié) 64
4.5 參考文獻(xiàn) 64
第5 章 分類變量:自動(dòng)化時(shí)代的數(shù)據(jù)計(jì)數(shù) 65
5.1 分類變量的編碼 66
5.1.1 one-hot 編碼 66
5.1.2 虛擬編碼 66
5.1.3 效果編碼 69
5.1.4 各種分類變量編碼的優(yōu)缺點(diǎn) 70
5.2 處理大型分類變量 70
5.2.1 特征散列化 71
5.2.2 分箱計(jì)數(shù) 73
5.3 小結(jié) 79
5.4 參考文獻(xiàn) 80
第6 章 數(shù)據(jù)降維:使用PCA 擠壓數(shù)據(jù) 82
6.1 直觀理解 82
6.2 數(shù)學(xué)推導(dǎo) 84
6.2.1 線性投影 84
6.2.2 方差和經(jīng)驗(yàn)方差 85
6.2.3 主成分:第 一種表示形式 86
6.2.4 主成分:矩陣- 向量表示形式 86
6.2.5 主成分的通用解 86
6.2.6 特征轉(zhuǎn)換 87
6.2.7 PCA 實(shí)現(xiàn) 87
6.3 PCA 實(shí)戰(zhàn) 88
6.4 白化與ZCA 89
6.5 PCA 的局限性與注意事項(xiàng) 90
6.6 用例 91
6.7 小結(jié) 93
6.8 參考文獻(xiàn) 93
第7 章 非線性特征化與k-均值模型堆疊 94
7.1 k-均值聚類 95
7.2 使用聚類進(jìn)行曲面拼接 97
7.3 用于分類問題的k-均值特征化 100
7.4 優(yōu)點(diǎn)、缺點(diǎn)以及陷阱 105
7.5 小結(jié) 107
7.6 參考文獻(xiàn) 107
第8 章 自動(dòng)特征生成:圖像特征提取和深度學(xué)習(xí) 108
8.1 最簡單的圖像特征(以及它們因何失效) 109
8.2 人工特征提取:SIFT 和HOG 110
8.2.1 圖像梯度 110
8.2.2 梯度方向直方圖 113
8.2.3 SIFT 體系 116
8.3 通過深度神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)圖像特征 117
8.3.1 全連接層 117
8.3.2 卷積層 118
8.3.3 ReLU 變換 122
8.3.4 響應(yīng)歸一化層 123
8.3.5 池化層 124
8.3.6 AlexNet 的結(jié)構(gòu) 124
8.4 小結(jié) 127
8.5 參考文獻(xiàn) 128
第9 章 回到特征:建立學(xué)術(shù)論文推薦器 129
9.1 基于項(xiàng)目的協(xié)同過濾 129
9.2 第 一關(guān):數(shù)據(jù)導(dǎo)入、清理和特征解析 130
9.3 第二關(guān):更多特征工程和更智能的模型 136
9.4 第三關(guān):更多特征= 更多信息 141
9.5 小結(jié) 144
9.6 參考文獻(xiàn) 144
附錄A 線性建模與線性代數(shù)基礎(chǔ) 145
A.1 線性分類概述 145
A.2 矩陣的解析 147
A.2.1 從向量到子空間 148
A.2.2 奇異值分解(SVD) 150
A.2.3 數(shù)據(jù)矩陣的四個(gè)基本子空間 151
A.3 線性系統(tǒng)求解 153
A.4 參考文獻(xiàn) 155
作者簡介 156
封面簡介 1562100433B
本書介紹大量特征工程技術(shù),闡明特征工程的基本原則。主要內(nèi)容包括:機(jī)器學(xué)習(xí)流程中
的基本概念,數(shù)值型數(shù)據(jù)的基礎(chǔ)特征工程,自然文本的特征工程,詞頻- 逆文檔頻率,高效的分類變量編碼技術(shù),主成分分析,模型堆疊,圖像處理,等等。
什么鋼筋 水泥 混凝土 土建預(yù)算 會(huì)計(jì)學(xué) 高數(shù)也要會(huì)點(diǎn) 制圖 讀圖 測量等 這些事主要的 其實(shí)最有用的還是概預(yù)算,,工程上用的最多了
你好! 在分部分項(xiàng)編輯界面,點(diǎn)擊屬性窗口的“特征及內(nèi)容”,在屬性窗口右邊會(huì)出現(xiàn)“清單名稱顯示”的界面。你選擇內(nèi)容選項(xiàng)中的“項(xiàng)目特征+內(nèi)容”,這樣在編輯界面就可以編輯項(xiàng)目特征及內(nèi)容了。如下圖。...
入門到精通肯定是沒電子版的,你需要的話可以再服務(wù)新干線上看視頻嘛,而且據(jù)說最近那個(gè)書都賣斷貨了,我一個(gè)朋友想買都沒得了~
格式:pdf
大小:19.0MB
頁數(shù): 15頁
評(píng)分: 4.6
本教材屬廣聯(lián)達(dá)公司所有,上傳前 10 頁只為分享 。教材只是掃描了前 10 頁,僅供大家 參 考 , 教 材 的 掃 描 質(zhì) 量 并 不 代 表 書 的 實(shí) 物 情 況 。 有 具 體 需 求 請(qǐng) 看 網(wǎng) 址 : http://item.taobao.com/item.htm?id=12806608056 正版印刷,質(zhì)量可靠。盜版,翻印圖文會(huì)不 清 晰
這套叢書針對(duì)不同層次的讀者,分為5個(gè)子系列:從入門到精通、技術(shù)內(nèi)幕、高級(jí)編程、精通和認(rèn)證考試教材。各系列特色如下:
★ 從入門到精通
*適合新手程序員的實(shí)用教程
*側(cè)重于基礎(chǔ)技術(shù)和特征
*提供范例文件
★ 技術(shù)內(nèi)幕
*權(quán)威、必備的參考大全
*包含豐富、實(shí)用的范例代碼
*幫助讀者熟練掌握微軟技術(shù)
★ 高級(jí)編程
*側(cè)重于高級(jí)特性、技術(shù)和解決問題
*包含豐富、適用性強(qiáng)的范例代碼
*幫助讀者精通微軟技術(shù)
★精通
*著重剖析應(yīng)用技巧,以幫助提高工作效率
*主題包括辦公應(yīng)用和開發(fā)工具
★ 認(rèn)證考試教材
*提供完整的Ebook(英文版)
*提供實(shí)際場景、案例分析和故障診斷實(shí)驗(yàn)
*完全根據(jù)考試要求來闡述每一個(gè)知識(shí)點(diǎn)
這套叢書延續(xù)以前嚴(yán)謹(jǐn)?shù)木幮oL(fēng)格,一切以保證圖書內(nèi)容和技術(shù)質(zhì)量為核心,付出了大量心血。相信整合后的這套叢書必然會(huì)幫助程序開發(fā)人員、網(wǎng)絡(luò)開發(fā)人員以及具有一定編程基礎(chǔ)的中、高級(jí)讀者,快速、全面地掌握微軟技術(shù),為將來的技術(shù)生涯奠定扎實(shí)的基礎(chǔ),使之成為中國軟件產(chǎn)業(yè)的棟梁!
《裝飾工程施工:專業(yè)技能入門與精通》:從校園到職場
大型工程一般都構(gòu)成一個(gè)非常復(fù)雜的大系統(tǒng),這個(gè)系統(tǒng)不僅內(nèi)部結(jié)構(gòu)復(fù)雜,而且外部聯(lián)系廣泛,常具有如下特征:
1、工程系統(tǒng)是由多個(gè)相互制約和相互影響的子系統(tǒng)(子工程)有機(jī)結(jié)合的整體。要使系統(tǒng)效益全面發(fā)揮,必須全部完成各子工程和相應(yīng)的配套工程,有時(shí)甚至還涉及到系統(tǒng)外一些工程。
2、工程建設(shè)可能產(chǎn)生的許多后果,影響深遠(yuǎn)重大,稍有疏忽,就會(huì)造成難以彌補(bǔ)的損失。但這些后果、影響往往又是可以預(yù)測和估價(jià)的。
3、由于工程規(guī)模龐大,一般來說工程結(jié)構(gòu)復(fù)雜,建設(shè)周期長,投資額大,相對(duì)來說效益也比較大。但另一方面,工程對(duì)政治、社會(huì)和生態(tài)系統(tǒng)的影響也很大,這一方面與小型工程相比有質(zhì)的變化,工程系統(tǒng)往往不只是一個(gè)自然的物理系統(tǒng),而是一個(gè)物理系統(tǒng)和事理系統(tǒng)的綜合體。
4、由于工程規(guī)模龐大、結(jié)構(gòu)復(fù)雜、涉及面廣、影響深遠(yuǎn),所以,與小型工程相比,工程建設(shè)風(fēng)險(xiǎn)大,而且非常集中,這使決策的難度和壓力大大增加。