1、特征碼(attribute code)用來判斷某段數據屬于哪個計算機字段。共計40個字符。
2、特征碼的獲取不可能再是簡單的取出一段代碼來,而是分段的,中間可以包含任意的内容(也就是增加了一些不參加比較的“掩碼字節”,在出現“掩碼字節”的地方,出現什麼内容都不參加比較)。這就是曾經提出的廣譜特征碼的概念。
3、随着網絡技術和信息技術的飛速發展,網絡已經成為人們獲取信息的一個重要途徑。現有的搜索引擎面臨的最大一個問題就是返回的結果集中包含大量重複的信息。如何更有效地幫助用戶獲取所需要的信息,能夠快速、準确地為用戶提供信息,是網絡信息服務面臨的新課題。優化搜索結果可以采用多種手段,如通過提取網頁的特征進行基于内容的信息檢索,利用用戶反饋的信息進一步精确檢索結果,将結果集中的重複信息盡可能地消除等。