性xx色动画xx无尽,国产精品三级av三级av三级 ,中文在线√天堂,亚洲国产成人久久一区久久,亚洲熟妇色l20p

當(dāng)前位置 : 首頁  圖書 正文

智能搜索引擎技術(shù)簡(jiǎn)介,目錄書摘

2019-10-21 19:00 來源:京東 作者:京東
搜索引擎
智能搜索引擎技術(shù)
暫無報(bào)價(jià)
10評(píng)論 100%好評(píng)
編輯推薦:
內(nèi)容簡(jiǎn)介:  《智能搜索引擎技術(shù)》以當(dāng)前搜索引擎主流技術(shù)為基礎(chǔ),密切關(guān)注前沿技術(shù)發(fā)展趨勢(shì),結(jié)合當(dāng)前人工智能和自然語言技術(shù)的發(fā)展,以深入淺出的形式介紹一套完整的大數(shù)據(jù)時(shí)代背景下的智能搜索引擎的關(guān)鍵技術(shù)。
  《智能搜索引擎技術(shù)》在吸取國內(nèi)外經(jīng)典教材優(yōu)點(diǎn)的基礎(chǔ)上,廣泛搜集合適的實(shí)例,通過實(shí)例從多個(gè)視角對(duì)智能搜索引擎的核心技術(shù)進(jìn)行全面介紹,加深讀者對(duì)關(guān)鍵概念和核心技術(shù)的理解。
  《智能搜索引擎技術(shù)》還對(duì)開源軟件進(jìn)行了介紹,將技術(shù)理論與應(yīng)用范例結(jié)合。
  《智能搜索引擎技術(shù)》共分為10章,通過采用循序漸進(jìn)的組織方式對(duì)搜索引擎的各個(gè)組成部分和核心技術(shù)進(jìn)行了介紹。第1章引言,對(duì)搜索引擎進(jìn)行了簡(jiǎn)要概述,介紹了搜索引擎與信息檢索的關(guān)系,搜索引擎的歷史、分類及基本架構(gòu)。第2章信息采集,主要圍繞搜索系統(tǒng)的核心——網(wǎng)絡(luò)爬蟲進(jìn)行介紹。第3章文本處理,對(duì)搜索引擎的文本處理功能進(jìn)行了介紹,包括文本信息的提取、自然語言中的統(tǒng)計(jì)語言模型、中英文分詞技術(shù)、網(wǎng)頁去重算法等。第4章搜索引擎索引構(gòu)建,主要介紹搜索引擎的索引系統(tǒng),包括倒排索引、建立索引的方式、索引的更新策略、分布式索引及索引壓縮算法。第5章基于文本內(nèi)容的檢索模型,對(duì)搜索引擎的檢索模型進(jìn)行了介紹,包括傳統(tǒng)的檢索模型,如布爾模型、向量空間模型、概率檢索模型和基于統(tǒng)計(jì)語言建模的檢索模型,以及基于機(jī)器學(xué)習(xí)的排序模型。第6章基于鏈接的檢索模型,主要對(duì)基于鏈接的檢索模型和針對(duì)鏈接作弊的反作弊模型進(jìn)行了介紹。第7章查詢處理與結(jié)果展示,主要對(duì)查詢條件的糾正與過濾、查詢處理與展示的技術(shù)進(jìn)行了介紹。第8章相關(guān)反饋與查詢擴(kuò)展,主要對(duì)圍繞著相關(guān)反饋和查詢擴(kuò)展的各項(xiàng)技術(shù)進(jìn)行了介紹,通過采用相關(guān)反饋和查詢擴(kuò)展的技術(shù)理解用戶的查詢意圖。第9章分類與聚類,主要介紹了在智能搜索引擎中用到的各種機(jī)器學(xué)習(xí)算法。第10章基于知識(shí)圖譜的搜索引擎,對(duì)未來搜索引擎的發(fā)展方向——基于知識(shí)圖譜的智能搜索引擎進(jìn)行了介紹,包括知識(shí)圖譜的構(gòu)建流程、構(gòu)建中的信息抽取、知識(shí)融合、知識(shí)表示與推理等關(guān)鍵技術(shù)及其在搜索引擎中的應(yīng)用。
  《智能搜索引擎技術(shù)》適用于數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)專業(yè)及其計(jì)算機(jī)相關(guān)專業(yè)的本科生或研究生以及從事該領(lǐng)域研究的人員。
  通過對(duì)《智能搜索引擎技術(shù)》的閱讀,可以使讀者對(duì)智能搜索引擎的相關(guān)知識(shí)有一個(gè)基本的了解,并為將來開展研究工作打下堅(jiān)實(shí)的基礎(chǔ)。
作者簡(jiǎn)介:
目錄:第1章 引言
1.1 信息檢索與搜索引擎
1.2 搜索引擎的歷史
1.3 搜索引擎的分類
1.4 搜索引擎的基本架構(gòu)
1.4.1 主要性能需求
1.4.2 總體架構(gòu)
1.5 搜索引擎的主要組件及其功能
1.5.1 網(wǎng)絡(luò)爬蟲
1.5.2 解析器
1.5.3 索引器
1.5.4 檢索器
1.5.5 用戶交互接口
1.6 開源搜索引擎
本章小結(jié)
習(xí)題

第2章 信息采集
2.1 網(wǎng)絡(luò)爬蟲的概述
2.1.1 網(wǎng)絡(luò)爬蟲的功能特點(diǎn)
2.1.2 網(wǎng)絡(luò)爬蟲通用架構(gòu)
2.1.3 網(wǎng)絡(luò)爬蟲分類
2.2 分布式網(wǎng)絡(luò)爬蟲架構(gòu)
2.2.1 主從分布式結(jié)構(gòu)爬蟲(master-slave)
2.2.2 對(duì)等分布式結(jié)構(gòu)爬蟲(peer to peer)
2.3 信息采集涉及的協(xié)議
2.3.1 URL規(guī)范和HTTP協(xié)議
2.3.2 User Agent
2.3.3 Robots協(xié)議
2.4 頁面遍歷
2.4.1 寬度優(yōu)先遍歷策略
2.4.2 深度優(yōu)先遍歷策略
2.4.3 重要度優(yōu)先遍歷策略
2.5 頁面更新
2.5.1 網(wǎng)頁更新策略
2.5.2 爬蟲更新方式
2.6 深網(wǎng)抓取
2.7 開源網(wǎng)絡(luò)爬蟲
本章小結(jié)
習(xí)題

第3章 文本處理
3.1 文本信息提取
3.1.1 網(wǎng)頁數(shù)據(jù)獲取
3.1.2 非網(wǎng)頁的數(shù)據(jù)獲取
3.2 統(tǒng)計(jì)語言模型
3.2.1 N元模型(N-gram)的基本概念
3.2.2 數(shù)據(jù)平滑方法
3.3 英文分詞
3.3.1 詞素切分
3.3.2 詞干提取
3.3.3 去除停用詞3.4 中文分詞
3.4.1 中文分詞概述
3.4.2 基于詞典的機(jī)械分詞法
3.4.3 基于統(tǒng)計(jì)的分詞法
3.4.4 分詞粒度
3.5 網(wǎng)頁去重
3.5.1 通用去重算法流程
3.5.2 Shingling算法
3.5.3 SimHash算法
本章小結(jié)
習(xí)題

第4章 搜索引擎索引構(gòu)建
4.1 倒排索引
4.1.1 倒排索引基礎(chǔ)
4.1.2 詞典結(jié)構(gòu)
4.1.3 倒排表結(jié)構(gòu)
4.2 建立索引方式
4.2.1 基于內(nèi)存的索引構(gòu)建
4.2.2 基于排序的索引建立
4.2.3 基于合并法的索引構(gòu)建
4.3 索引更新
4.4 分布式索引
4.4.1 數(shù)據(jù)劃分
4.4.2 冗余和容錯(cuò)
4.4.3 Elastic Search的分布式索引
4.5 索引壓縮
4.5.1 評(píng)價(jià)壓縮算法的指標(biāo)
4.5.2 Delta編碼(D-Gaps)
4.5.3 無參數(shù)間距壓縮編碼
4.5.4 參數(shù)間距壓縮
4.5.5 高查詢性能的編碼
本章小結(jié)
習(xí)題

第5章 基于文本內(nèi)容的檢索模型
5.1 檢索模型概述
5.2 布爾模型
5.3 向量空間模型
5.3.1 文本表示
5.3.2 查詢相關(guān)度計(jì)算
5.4 概率檢索模型
5.4.1 概率檢索模型概述
5.4.2 二元獨(dú)立模型(binary independent model)
5.4.3 BM25模型
5.4.4 BM25F模型
5.5 基于統(tǒng)計(jì)語言建模的檢索模型
5.6 機(jī)器學(xué)習(xí)排序
5.6.1 機(jī)器學(xué)習(xí)排序概述
5.6.2 單文檔方法(pointwise approach)
5.6.3 文檔對(duì)方法(pairwise approach)
5.6.4 文檔列表方法(listwise approach)5.7 檢索質(zhì)量評(píng)價(jià)標(biāo)準(zhǔn)
5.7.1 準(zhǔn)確率和召回率
5.7.2 前k個(gè)文檔的查準(zhǔn)率(P@k)
5.7.3 平均查準(zhǔn)率均值(mean average precision,MAP)
5.7.4 NDCG(normalize DCC)
本章小結(jié)
習(xí)題

第6章 基于鏈接的檢索模型
6.1 Web圖
6.2 Page Rank算法
6.2.1 基于簡(jiǎn)單模型的Page Rank算法
6.2.2 基于隨機(jī)沖浪模型的Page Rank算法
6.2.3 主題敏感的Page Rank
6.3 HITS算法
6.3.1 HITS算法基本思想
6.3.2 HITS算法流程
6.3.3 HITS的優(yōu)勢(shì)與缺陷
6.4 SALAS算法
6.5 通用鏈接反作弊方法
6.5.1 鏈接作弊方法
6.5.2 反鏈接作弊思路
6.5.3 經(jīng)典鏈接反作弊算法
本章小結(jié)
習(xí)題

第7章 查詢處理與結(jié)果展示
7.1 查詢糾錯(cuò)
7.1.1 查詢糾錯(cuò)概述
7.1.2 英文糾錯(cuò)
7.2 搜索智能提示
7.3 不安全信息過濾
7.4 查詢處理
7.4.1 “一次一文檔”
7.4.2 “一次一詞”
7.5 結(jié)果展示
7.5.1 頁面摘要
7.5.2 查詢結(jié)果聚類
7.6 查詢緩存機(jī)制
本章小結(jié)
習(xí)題

第8章 相關(guān)反饋與查詢擴(kuò)展
8.1 相關(guān)反饋框架
8.2 顯式相關(guān)反饋
8.2.1 Rocchio相關(guān)反饋算法
8.2.2 概率相關(guān)反饋
8.2.3 相關(guān)反饋策略的評(píng)價(jià)
8.3 偽相關(guān)反饋
8.4 隱式反饋
8.5 查詢擴(kuò)展
本章小結(jié)
習(xí)題

第9章 分類與聚類
9.1 文本分類
9.1.1 文本分類框架
9.1.2 貝葉斯文檔分類
9.1.3 支持向量機(jī)
9.1.4 特征選擇
9.1.5 評(píng)價(jià)
9.2 聚類
9.2.1 劃分聚類
9.2.2 層次聚類
9.2.3 評(píng)價(jià)
本章小結(jié)
習(xí)題

第10章 基于知識(shí)圖譜的搜索引擎
10.1 概述
10.2 知識(shí)圖譜的數(shù)據(jù)獲取
10.3 信息抽取
10.3.1 實(shí)體抽取
10.3.2 關(guān)系抽取
10.3.3 屬性抽取
10.4 知識(shí)融合
10.4.1 實(shí)體對(duì)齊
10.4.2 實(shí)體歧義分析
10.5 知識(shí)表示與知識(shí)推理
10.5.1 知識(shí)表示
10.5.2 知識(shí)推理
10.6 基于知識(shí)圖譜的智能搜索引擎
10.6.1 基于知識(shí)圖譜的搜索結(jié)構(gòu)
10.6.2 查詢理解
10.6.3 自動(dòng)問答
本章小結(jié)
習(xí)題

參考文獻(xiàn)
熱門推薦文章
相關(guān)優(yōu)評(píng)榜
品類齊全,輕松購物 多倉直發(fā),極速配送 正品行貨,精致服務(wù) 天天低價(jià),暢選無憂
購物指南
購物流程
會(huì)員介紹
生活旅行/團(tuán)購
常見問題
大家電
聯(lián)系客服
配送方式
上門自提
211限時(shí)達(dá)
配送服務(wù)查詢
配送費(fèi)收取標(biāo)準(zhǔn)
海外配送
支付方式
貨到付款
在線支付
分期付款
郵局匯款
公司轉(zhuǎn)賬
售后服務(wù)
售后政策
價(jià)格保護(hù)
退款說明
返修/退換貨
取消訂單
特色服務(wù)
奪寶島
DIY裝機(jī)
延保服務(wù)
京東E卡
京東通信
京東JD+