Databricks Genie ไม่ได้พยายามเอาชนะ coding agent ด้วยการเป็นนักเขียนโค้ดทั่วไปที่เก่งกว่า จุดขายของมันคือการมองว่า analytics ในองค์กรเป็นปัญหาเรื่องบริบท: ระบบต้องเข้าใจคำศัพท์ธุรกิจ หา data asset ที่ถูกต้อง สร้างคิวรีให้ตรงนิยาม และอธิบายผลลัพธ์บนหลักฐานที่มี
Databricks ระบุว่า Genie ทำความแม่นยำรวมได้มากกว่า 90% ใน benchmark ภายในที่ใช้โจทย์วิเคราะห์ข้อมูลจากโลกจริง เทียบกับ 32% ของ coding agent ชั้นนำรายหนึ่ง แต่ตัวเลขนี้เป็นการรายงานโดย Databricks เอง ไม่ใช่การตรวจสอบอิสระจากบุคคลที่สาม [3]
จุดต่างสำคัญ: ในองค์กร บริบทสำคัญกว่าแค่เขียน SQL ให้รันได้
Coding agent ทั่วไปช่วยเขียน SQL หรือ Python ได้ดีขึ้นเรื่อย ๆ แต่คำถามข้อมูลในบริษัทใหญ่ไม่ค่อยมีคำตอบจากโค้ดเพียว ๆ เช่น คำว่า รายได้, ลูกค้าที่ใช้งานจริง, churn หรือยอดขายสุทธิ อาจมีนิยามเฉพาะทีม เฉพาะประเทศ หรือเฉพาะระบบ และอาจต้องใช้ตารางหรือแดชบอร์ดที่องค์กรรับรองแล้ว
เอกสาร Microsoft Learn ของ Azure Databricks อธิบาย Genie ว่าเป็น generative AI ที่ปรับให้เข้ากับคำศัพท์และข้อมูลขององค์กร โดยให้ผู้เชี่ยวชาญโดเมนตั้งค่า Genie spaces ด้วยชุดข้อมูล ตัวอย่างคิวรี และแนวทางข้อความ เพื่อช่วยแปลคำถามธุรกิจเป็นคิวรีวิเคราะห์ [7] พูดง่าย ๆ คือ Genie ไม่เริ่มจาก prompt เปล่า แต่เริ่มจากพื้นที่ข้อมูลที่ถูกจัดบริบทไว้แล้ว
1. ใช้ semantics ขององค์กร ไม่ใช่แค่คำสั่งใน prompt
คำถามภาษาธรรมชาติอย่าง “ทำไมรายได้ลดลง” อาจฟังตรงไปตรงมา แต่ในองค์กรจริง คำตอบขึ้นกับนิยามรายได้ที่ได้รับอนุมัติ ช่วงเวลาที่ต้องใช้ กลุ่มลูกค้าที่เกี่ยวข้อง และตารางหลักที่ถือเป็นแหล่งข้อมูลเชื่อถือได้
Genie spaces เปิดให้ผู้เชี่ยวชาญในแต่ละโดเมนใส่ชุดข้อมูล ตัวอย่างคำถามหรือคิวรี และคำแนะนำที่ช่วยกำหนดว่า Genie ควรตีความคำถามอย่างไร [7] เอกสารเดียวกันยังระบุว่าองค์กรสามารถติดตามและปรับปรุงประสิทธิภาพของ Genie ผ่าน feedback จากผู้ใช้ได้ ดังนั้นความแม่นยำจึงไม่ได้มาจากโมเดลอย่างเดียว แต่ขึ้นกับการป้อนบริบททางธุรกิจที่ถูกต้องให้ระบบด้วย






