Semantik arama ise tamamen farklı bir yol izler. Sistem, önce sorgunuzu ve her belgeyi vektör yerleştirmelerine (vector embeddings) dönüştürür — bunlar anlamı kodlayan yoğun matematiksel temsillerdir. Ardından, kosinüs benzerliği (cosine similarity) gibi mesafe ölçütleri kullanarak vektörler arasındaki benzerliği hesaplar . "Gitar öğrenmenin en iyi yolu" sorgusu, "gitar akorları nasıl çalışılır" konulu bir belgeyle eşleşebilir çünkü vektörler anlam uzayında birbirine yakındır, hiçbir kelime birebir örtüşmese bile
.
İki yaklaşım arasındaki en belirgin fark, niyet ile harfiyen eşleşme arasındaki ayrımdır.
Semantik arama, tek tek kelimelerin ötesine geçerek bir sorgunun daha geniş bağlamını değerlendirir. Kullanıcının konumunu, geçmiş aramalarını ve günün saatini hesaba katabilir. "En iyi restoranlar" araması, kullanıcı New York'ta mı yoksa Londra'da mı olduğuna göre farklı sonuçlar verir . Birçok semantik arama motoru, "Paris" ile "Fransa", "Eyfel Kulesi" ve "başkent" gibi kavramları birbirine bağlayan devasa varlık ve ilişki veritabanları olan bilgi grafiklerinden (knowledge graphs) de yararlanır
.
Buna karşılık anahtar kelime araması, her terimi tek başına ele alır. "Araba" ve "otomobil"in aynı kavramı ifade ettiğini anlayacak bir mekanizması yoktur, ta ki bir insan her iki terimi de sorguya veya indekslenen içeriğe açıkça dahil edene kadar .
Anahtar kelime araması basit, hızlı ve hemen hemen her altyapıya kolayca kurulabilir . Temel donanımlarla bile iyi ölçeklenir ve özel modeller veya vektör veritabanları gerektirmez.
Semantik arama ise daha fazla işlem gücü, sinir ağı modeli altyapısı ve genellikle bir vektör veritabanı gerektirir . Yerleştirmeler (embeddings) oluşturmak ve depolamak kaynak tüketir ve yüksek boyutlu vektör uzayında en yakın komşuları bulma adımı, ters indeksi taramaktan hesaplama açısından daha ağırdır. Bunun karşılığında, özellikle sohbet tarzı ve keşfedici aramalarda belirgin şekilde daha iyi bir hatırlama (recall) oranı elde edilir
.
Birçok modern yapay zeka aracı sizi birini seçmeye zorlamaz. Hibrit arama, anahtar kelime ve semantik yaklaşımları birleştirir, her iki getiriciyi (retriever) paralel olarak çalıştırır ve sonuçları birleştirir . Böylece belirli tanımlayıcılar için tam terim eşleştirmenin hassasiyetini ve belirsiz veya sohbet tarzı sorgular için semantik anlayışın hatırlama gücünü aynı anda elde edersiniz. Bu, giderek kurumsal arama, e-ticaret ürün keşfi ve yapay zeka destekli bilgi tabanlarında varsayılan mimari haline gelmektedir.
Anahtar kelime araması, kullanıcılar tam olarak ne aradıklarını bildiklerinde vazgeçilmez olmaya devam ediyor. Semantik arama ise, kullanıcıların çoğu zaman yaptığı gibi, doğal dilde ifade ettiklerinde dönüştürücü bir etki yaratıyor. Bu farkı anlamak, doğru getirme stratejisini seçmenize — veya her ikisini birleştirmenize — ve insanların gerçekten kastettiğini anlayan bir arama sistemi kurmanıza yardımcı olur.
Comments
0 comments