作者 企翔網(wǎng)絡(luò) 來(lái)源 企翔網(wǎng)絡(luò) 瀏覽 發(fā)布時(shí)間 19/05/29
目前有很多種倒排列表壓縮算法可供選樣,但是評(píng)判算法的優(yōu)劣需要定量指標(biāo)。般來(lái)說(shuō),評(píng)價(jià)例排列表壓縮算法會(huì)考慮3方面的指標(biāo)1壓縮率、壓縮速度和解壓速度。
所謂壓縮率,是數(shù)據(jù)壓縮前大小和壓縮后大小的比例關(guān)系,很明顯,莊縮率越高越節(jié)省磁盤空間,同時(shí)也節(jié)省了倒排列表從磁盤讀入到內(nèi)存的I/O 時(shí)間。
壓縮速度是指用縮定的數(shù)據(jù)所花費(fèi)的時(shí)間,相劉而言,這個(gè)指標(biāo)不如其他兩個(gè)標(biāo)重要,因?yàn)閴嚎s往社是在建立索引過(guò)程中進(jìn)行的,而建立索引是個(gè)后臺(tái)運(yùn)行過(guò)程, 需要即時(shí)響應(yīng)用戶查詢,即使速度慢些也沒有太大關(guān)系。另外,建立索引的次數(shù)相對(duì)也不算多,所以從兒個(gè)方面考慮,壓縮速度不是個(gè)重要指標(biāo)。
解壓速度在3個(gè)指標(biāo)中是重要的,其含義是將壓縮數(shù)據(jù)再次恢復(fù)為原始數(shù)據(jù)所用的時(shí)間。因?yàn)樗阉饕嬖陧憫?yīng)用戶查詢時(shí),從磁盤讀入的是壓縮后的數(shù)據(jù),需要實(shí)時(shí)解壓數(shù)據(jù)以快速響應(yīng)用戶,所以解壓速度自接關(guān)系到系統(tǒng)的用戶體驗(yàn),其重要性不言而喻。
網(wǎng)站首頁(yè) | 關(guān)于企翔 | 網(wǎng)站建設(shè) | 網(wǎng)站推廣 | 手機(jī)微信 | 成功案例 | seo培訓(xùn) | 聯(lián)系企翔
@2008-2017 版權(quán)所有 河南企翔網(wǎng)絡(luò)技術(shù)有限公司 豫ICP備2022028385
新鄉(xiāng)網(wǎng)絡(luò)公司 新鄉(xiāng)seo 新鄉(xiāng)網(wǎng)站優(yōu)化 新鄉(xiāng)網(wǎng)站托管 新鄉(xiāng)網(wǎng)站建設(shè)