Hotline Redaksi: 0817-21-7070 (WA/Telegram)
Viral

Pencarian Tetangga Terdekat Berskala Miliar yang Sangat Efisien – Majalah Time.com

×

Pencarian Tetangga Terdekat Berskala Miliar yang Sangat Efisien – Majalah Time.com

Sebarkan artikel ini
Pencarian Tetangga Terdekat Berskala Miliar yang Sangat Efisien – Majalah Time.com

[ad_1]

Pencarian tetangga terdekat vektor, yang memberikan hasil yang relevan dengan mencari vektor dengan jarak minimum ke vektor kueri, sangat penting di area pencarian informasi. Banyak algoritma perkiraan pencarian tetangga terdekat (ANNS) telah diusulkan; namun, dalam skenario skala besar, seperti pencarian web, biaya memori menjadi sangat mahal.

Sebuah makalah baru-baru ini di arXiv.org berpendapat bahwa pendekatan indeks terbalik sederhana juga dapat mencapai kinerja canggih untuk kumpulan data skala besar dalam hal penarikan kembali, latensi, dan biaya memori.

SPANN, sistem pencarian dan pengindeksan vektor hibrid memori-disk yang sederhana dan efisien, diusulkan. Ini menjamin latensi rendah dan ingatan tinggi dengan sangat mengurangi jumlah akses disk dan meningkatkan kualitas daftar posting. Eksperimen menunjukkan bahwa SPNN lebih dari dua kali lebih cepat daripada algoritme ANNS yang canggih untuk mencapai kualitas ingatan yang sama.

Algoritme dalam memori untuk perkiraan pencarian tetangga terdekat (ANNS) telah mencapai sukses besar untuk pencarian dengan ingatan tinggi yang cepat, tetapi sangat mahal ketika menangani basis data skala sangat besar. Jadi, ada peningkatan permintaan untuk solusi ANNS hybrid dengan memori kecil dan solid-state drive (SSD) yang murah. Dalam makalah ini, kami menyajikan sistem pengindeksan dan pencarian hibrid memori-disk yang sederhana namun efisien, bernama SPNN, yang mengikuti metodologi indeks terbalik. Ini menyimpan titik pusat dari daftar posting di memori dan daftar posting besar di disk. Kami menjamin efisiensi akses disk (latensi rendah) dan penarikan tinggi dengan secara efektif mengurangi nomor akses disk dan mengambil daftar posting berkualitas tinggi. Pada tahap pembuatan indeks, kami mengadopsi algoritma pengelompokan seimbang hierarkis untuk menyeimbangkan panjang daftar posting dan menambah daftar posting dengan menambahkan poin dalam penutupan cluster yang sesuai. Pada tahap pencarian, kami menggunakan skema query-aware untuk secara dinamis memangkas akses daftar posting yang tidak perlu. Hasil percobaan menunjukkan bahwa SPANN adalah 2× lebih cepat dari solusi ANNS mutakhir DiskANN untuk mencapai kualitas penarikan yang sama 90% dengan biaya memori yang sama dalam tiga set data skala miliar. Itu bisa mencapai 90% [email protected] dan [email protected] hanya dalam waktu sekitar satu milidetik dengan biaya memori hanya 32GB. Kode tersedia di ini https URL.

Makalah penelitian: Chen, Q., “SPANN: Pencarian Tetangga Terdekat Berskala Miliar yang Sangat Efisien”, 2021. Tautan: https://arxiv.org/abs/2111.08566



[ad_2]

Tinggalkan Balasan

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *

pola jam hoki mahjong black scatter surabaya raih 688 juta

gates of olympus 1000 meledak 912 juta pemain medan

scatter wild emas 7 kali beruntun pemain bali 555 juta

gold bonanza ngamuk 10 putaran semarang raup 701 juta

trik putaran ganjil mahjong black scatter yogyakarta 599 juta

pola gelap olympus 1000 kakek merah palembang 834 juta

25 spin gold bonanza scatter bombardir makassar 645 juta

mahjong black scatter mode sultan menang 750 juta malang

scatter emas turun terus bandung barat dapat 489 juta

gates of olympus 1000 petir merah strategi lampung 950 juta

tracon 200juta scatter hitam mahjong

pola tracon mahjong2 maxwin

tracon rekor scatter hujan

trik tracon auto cuan mahjong3

pola scatter wild tracon jam hoki

tracon analisis scatter hitam hoki

anti rungkad tracon mahjong basah

tantangan tracon 1juta lipatganda

scatter wild vs hitam tracon eksperimen

strategi tracon kemenangan konsisten

dina pegbinangkab scatter hitam koi gate 500 juta

rian pegbinangkab pola maxwin starlight princess x500

siska pegbinangkab rekor scatter hujan emas

bima pegbinangkab trik jackpot gates of olympus

dewi pegbinangkab pola scatter wild jam gacor

strategi game online mesin cuan keuntungan besar

pola scatter hitam menang tersembunyi jackpot rahasia

trik kuasai rtp efektif panduan kemenangan terjamin

karyawan bank raup 98 juta kisah sukses pola permainan

trik aguan raup 1 3 miliar strategi spin akurat investor

rahasia pola akurat investor keuntungan maksimal

rtp bisnis investasi pendek strategi hasil cepat

game online pola pikir miliarder hobi jadi kekayaan

pola ujang rtp 98 trik kemenangan akurat

tips kuasai rtp kemenangan trik konsisten untung

pola rahasia starlight princess jam gacor jackpot anti rungkad

trik wild west gold strategi bet kecil hasilkan 5 juta cepat

cara kerja rtp gates olympus kakek zeus data lapangan

strategi slow spin sweet bonanza multiplier x100 analisa akurat

cuan toolkit mahjong ways 2 scatter hitam trending pemula