ตัวอย่างการออกแบบการกรองเอกสาร

แนะนําสําหรับ:

  • อุปกรณ์: ไม่ทราบ

  • Quartus®: v17.1

author-image

โดย

ตัวอย่างนี้แสดงตัวอย่างว่าตัวกรองบานสามารถช่วยเพิ่มประสิทธิภาพของแอปพลิเคชันได้อย่างไร

การกรองเอกสารเกี่ยวข้องกับการดูการสตรีมเอกสารที่เข้ามาและค้นหาเอกสารที่ตรงกับความสนใจของผู้ใช้มากที่สุด ตัวอย่างของระบบดังกล่าวคือการใช้กลไกการกรองซึ่งตรวจสอบฟีดข่าวและส่งบทความที่เกี่ยวข้องไปยังบัญชีอีเมลของผู้ใช้ โดยทั่วไปแล้ว แอปพลิเคชันนี้เป็นตัวอย่างของการดําเนินการวิเคราะห์ข้อมูลที่ไม่มีโครงสร้าง เช่น ไฟล์ข้อความ หน้า HTML อีเมล และไฟล์วิดีโอ มีการประเมินว่าข้อมูลที่เกี่ยวข้องทั้งหมดสําหรับธุรกิจถึง 80% อยู่ในรูปแบบที่ไม่มีโครงสร้าง

อัลกอริทึมจะพยายามค้นหาเอกสารที่ตรงกันที่สุดสําหรับโปรไฟล์การค้นหาที่เฉพาะเจาะจง โปรไฟล์การค้นหาคือตัวกรองที่ตรงกับเอกสารเทียบกับหัวข้อที่ผู้ใช้สนใจ ด้วยเหตุนี้แต่ละเอกสารจึงลดลงเป็นชุดคําและความถี่ของรูปลักษณ์ของแต่ละคําในเอกสาร แต่ละคู่ความถี่ (t_i; f_i) ในเอกสารแสดงเป็นจํานวนเต็ม 32 บิต พร้อมด้วย ID คําแบบ 24 บิต และความถี่ 8 บิตที่เกิดขึ้น โดยทั่วไปคําในเอกสาร ID 24 บิตช่วยให้มีคําศัพท์มากกว่า 16 ล้านคํา โปรไฟล์การค้นหาประกอบด้วยชุดคําที่เล็กลง และน้ําหนักสําหรับแต่ละคําที่ระบุความสําคัญที่เกี่ยวข้องในโปรไฟล์การค้นหา น้ําหนักประกอบด้วยหมายเลข 64 บิตในการแสดงจุดคงที่ ในการค้นหาที่ไม่มีโครงสร้าง คะแนนจะถูกคํานวณสําหรับทุกเอกสารเพื่อกําหนดความเกี่ยวข้องของส่วนกําหนดค่าดังกล่าว

ข้อมูลอินพุตไปยังเคอร์เนลมีดังนี้:

  • docWordFrequencies แสดงเอกสารประกอบเอกสารการใช้งานในโปรแกรม DocWordFrequencies หรือ DocWordFrequencies: 8 บิวด์เวิร์คโฟลด์เกิร์ลเกิร์ลเกิร์ซเกิร์ลเกิร์ลเกิร์ซเกิร์ลเกิร์ซเกิร์ลเหินเวทีเเละเเยก
  • profileWeights คือ ชุดนาฬาคมนาคม และชุดนาฬิกคมนาคมรุ่นเล็กๆ และรุ่นอื่น ๆ ในรุ่น ProfileWeights คือ 64b/1000b/64b/1004b/1004-1004-1004-profile/profile-state/profileWeights/ 64b/104b/104-1004
  • isWordInProfileHash เป็นตัวกรองที่จัดการโดย WordInProfileHash และ 4000 ต่อ 10000 ต่อ 10000 Bloom55 และ Bloom5 ได้ทําการคํานวณตามคําจํากัดความของ Bloom5 การใช้งานการใช้งานด้วยระบบเน็ตบาสเกตหรือการประกวดผลิตภัณฑ์ของ 1000011 ใน 11:00 น. 12:00 น. 10:00 น. 10:00 น. 1.00 น. 10:00 น. 10:00 น. 10:00 น. profileWeights

ข้อมูลเอาต์พุตไปยังเคอร์เนลคือ:

  1. profileScorePerGroup_highbits: 32 ตร.ม. 32 ตร.ม.
  2. profileScorePerGroup_lowbits คือ 32 ตร.ม. 32 ตร.ม. อรรคพงศ์

และยังแสดงถึงคะแนนของเอกสารที่บ่งบอกถึงความเกี่ยวข้องของเอกสารนั้นๆ กับโปรไฟล์นั้นๆ เพื่อปรับปรุงปริมาณงานของแอปพลิเคชันนี้เราได้แบ่งอินพุตออกเป็นสองส่วนที่มีขนาดเท่ากันโดยส่วนหนึ่งอาศัยอยู่ในธนาคารหน่วยความจํา DDR แต่ละแห่ง ซึ่งระบุโดย_dimm1 (สําหรับ DIMM ตัวแรก) และ_dimm2 (สําหรับ DIMM ตัวที่สอง) ที่ต่อท้ายพารามิเตอร์ของเคอร์เนล ซึ่งจะช่วยเพิ่มประสิทธิภาพของเราโดยการใช้ประโยชน์จากสองธนาคารหน่วยความจําที่มีอยู่

ดาวน์โหลด

™2010 และ Windows Windows โครงการ Microsoft Visual Studio 2010 และ 2010 ของ Microsoft Visual Studio 2010

การดาวน์โหลดต่อไปนี้มีให้สําหรับตัวอย่างนี้:

การใช้การออกแบบนี้อยู่ภายใต้และอยู่ภายใต้ข้อกําหนดและเงื่อนไขของข้อตกลงสิทธิ์การใช้งานการออกแบบที่อ้างอิงฮาร์ดแวร์

มีซอฟต์แวร์Intel® FPGA SDK สําหรับ OpenCL ที่มีให้ใช้งานในชิปเมนตอล

โลโก้ OpenCL และ OpenCL ที่รวมตัวกันของ Apple Inc. ซึ่งอยู่ในตําแหน่งเดียวกันกับ Khronos

* Khronos ได้ใช้ Khronos ในแบบ Khronos ได้แล้ว Khronos และได้เปิดใช้งาน Khronos, Khronos ได้แล้วและยังได้ www.khronos.org/conformance

ข้อกําหนดซอฟต์แวร์และฮาร์ดแวร์

เนื้อหาในหน้านี้เป็นการผสมผสานระหว่างการแปลเนื้อหาต้นฉบับภาษาอังกฤษโดยมนุษย์และคอมพิวเตอร์ เนื้อหานี้จัดทำขึ้นเพื่อความสะดวกของคุณและเพื่อเป็นข้อมูลทั่วไปเท่านั้นและไม่ควรอ้างอิงว่าสมบูรณ์หรือถูกต้อง หากมีความขัดแย้งใด ๆ ระหว่างเวอร์ชันภาษาอังกฤษของหน้านี้กับคำแปล เวอร์ชันภาษาอังกฤษจะมีผลเหนือกว่าและควบคุม ดูเวอร์ชันภาษาอังกฤษของหน้านี้