شنوّة هي الـ Vector Database

SAMI
نوفمبر 4, 2025 1 min to read
Share

هاو ديما نسمعو في كلمة Vector Database في كل حاجة عندها علاقة بالـ AI، أما شنوّة معناها بالضبط؟ وعلاش نحتاجوها؟ وشنوّة الفرق بينها وبين قواعد البيانات العادية؟


الـ Vector Database هي قاعدة بيانات مهيّئة باش تخزّن وتتعامل مع الـ Vectors.
يعني بدل ما تخزّن نصوص ولا أرقام كيما العادة، هي تخزّن Embeddings، تمثيلات رقمية للبيانات، وتخلّيك تبحث بالمعنى مش بالحرف.

في الـ SQL، البحث يكون على التطابق الحرفي (exact match)، أما في الـ Vector DB يكون البحث على التشابه في المعنى (similarity search).

مثال بسيط:
عندك قاعدة بيانات فيها أوصاف متاع منتوجات، وسألتها:

“نحب منتوج ينفع للسفر والشتا”

الـ Vector DB ما تمشيش تدور على الكلمات بالحروف،
بل تلقالك منتوجات معناها قريب كيما “جاكيت ضد المطر” ولا “كيس ظهر ما يدخّلش الماء”.

Vector Database

شنوّة هو الـ Vector

الـ Vector هو مجموعة أرقام مرتّبة تعبّر على نقطة في فضاء رياضي.
بكلام أسهل، هو Array متاع أرقام يمثّل موقع ولا معنى ولا اتّجاه.

مثال:

  • [2,3] تمثّل نقطة في محور ثنائي.
  • [1,0,-1] تمثّل نقطة في فضاء ثلاثي.

في المات، نستعمل الـ Vectors باش نعبّرو على الاتجاهات،
أما في الـ AI نستعملهم باش نعبّرو على المعاني.

باختصار، الـ Vector هو Array من أرقام يعبّر على معنى.


شنوّة هو الـ Embedding

الـ Embedding هي العمليّة إلي تحوّل النصوص ولا الصور ولا الأصوات إلى Vector.

يعني، كي تقول “قهوة” و“بنّ”، الـ Embedding متاعهم يكون قريب برشا،
أما “قهوة” و“بحر” يكونو بعاد، خاطر ما فماش علاقة.

كاين برشا Embedding Models تخدم على هكا، من أشهرهم:
OpenAI text-embedding-3 و Cohere Embeddings


علاش نحتاجو الـ Vector Databases

خاطرها تحلّ مشكلتين كبار:

  1. البحث بالمعنى موش بالحروف
    القواعد الكلاسيكية كيما SQL ولا MongoDB ما تفهمش المعنى،
    أما الـ Vector DB تفهم السياق وتخليك تعمل بحث ذكي،
    كيف كي تسأل ChatGPT ولا Gemini، يفهم قصدك مش الكلمات.
  2. السرعة في البحث
    البحث العادي في كميات كبيرة من البيانات ياخو وقت ومش دايمًا يعطي نتيجة مفيدة،
    أما الـ Vector DB تستعمل خوارزميات كيما Nearest Neighbour Search،
    تلقى النتائج المشابهة بسرعة كبيرة.

مقارنة بين الـ VDB والـ Traditional DB

المقارنةالقواعد العاديةVector Databases
نوع البياناتنصوص، أرقام، تواريخVectors
طريقة البحثبالكلمات أو الشروطبالمعنى (Semantic Search)
الاستعمالتطبيقات ويب، مالية، تقاريرAI، بحث دلالي، تحليل صور ونصوص
الأمثلةMySQL، PostgreSQL، MongoDBPinecone، Milvus، Weaviate

وين نلقاوها مستعملة

  • Search Engines: كيما Google، ترجّع صور ومواقع قريبة من معنى البحث.
  • Fraud Detection: تحلّل أنماط الاستعمال وتكشف الاستعمال الغريب ولا المشبوه.
  • Recommendation Systems: في E-Commerce ولا Netflix مثلاً،
    توصّي بمحتوى قريب من ذوقك ولا تاريخ بحثك.
  • RAG Apps: في الشركات، تخزّن بيانات ذكية باش الـ LLM يعرف يجاوب المستخدمين بالسياق الصحيح.

كيفاش تخدم الـ Vector Databases

الفكرة إننا نحولو كل حاجة لأرقام خاطر الحاسوب يفهم الأرقام خير من النصوص.
الأرقام إلي تتكلم على نفس الموضوع تكون قريبة لبعضها،
مثلاً كي نبحث على “قطط”، تلقالي حتى “هرة” و“قطقوطة” و“حيوان أليف”.

كل بعد (Dimension) يمثّل خاصية، مثلاً اللون، الشكل، الفصيلة، إلخ.


المكوّنات الأساسية متاع الـ Vector Database

  1. Data Ingestion Layer
    تستقبل البيانات، تحوّلها لـ Embeddings، وتخزّنها مع الـ Metadata.
  2. Storage Layer
    تخزّن الـ Vectors في الـ Disk ولا في الـ Memory.
  3. Indexing Layer
    تسهّل البحث السريع على المتجهات المتشابهة باستعمال خوارزميات كيما:
    HNSW, IVF, PQ, Faiss, Annoy، إلخ.
  4. Query Layer
    وقت المستخدم يسأل، يتحوّل السؤال لـ Vector، وتتقارن المتجهات باش يرجع أقرب معنى.
  5. Metadata & Filtering Layer
    تستعملها باش تعمل Filters وتضيّق نطاق البحث حسب الخصائص.

Vector Database
Vector Database

أمثلة على Vector Databases

  • Pinecone: معروفة بسرعة الأداء وسهلة الدمج مع OpenAI وLangChain.
  • Weaviate: مفتوحة المصدر وتدعم Hybrid Search (كلمة + معنى).
  • Milvus: قوية برشا وممتازة في الأداء، مثالية للمشاريع الكبيرة.
  • Qdrant: مكتوبة بلغة Rust، خفيفة وسريعة.
  • Chroma: مفتوحة المصدر، تنجم تشغّلها Locally على حاسوبك، مثالية للتجارب والـ prototyping.

في الخلاصة

الـ Vector Databases ولات من ركائز الذكاء الاصطناعي.
تفهم المعنى، سريعة، وتنجم تخدم في تطبيقات البحث، التوصية، والتحليل الذكي.
خلي عينك ديما مفتوحة على التحديثات في المجال هذا، خاطر المستقبل ماشي الكل نحوه.

More information can be found on my personal blog https://tech-tech.life

1️⃣ Distributed Systems & System Design
https://lnkd.in/dgxJHk3C

2️⃣ Databases (قواعد البيانات)
https://lnkd.in/df3ZJTrz

3️⃣ Networks & Cybersecurity (الشبكات وأمن الأنظمة)
https://lnkd.in/d5q2_4tK

4️⃣ Operating Systems (أنظمة التشغيل)
https://lnkd.in/dnmF22-U

5️⃣ AI & Generative Systems (الذكاء الاصطناعي والأنظمة التوليدية)
https://lnkd.in/dfeezkBt

6️⃣ General Topics (مواضيع عامّة في عالم البرمجيات)
https://lnkd.in/dUGFs-M6

Leave a comment

Your email address will not be published. الحقول الإلزامية مشار إليها بـ *