تي اف-اي دي دف
عودة للموسوعةمعامل التي اف-اي دي دف (تردد المصطلح-معكوس تردد الوثيقة(TF-IDF)) هومعامل غالبا ما يستخدم في استرجاع المعلومات وتعدين النصوص. هذا المعامل هومقياس إحصائي يستخدم لتقييم مدى أهمية وجود حدثة في مستند معين في ذخيرة النصوص. الأهمية تزيد نسبيا بزيادة عدد مرات ظهور الحدثة أوالمصطلح في المستند ولكن تُقَأبَل بتردد الحدثة في الذخيرة بشكل عام. غالبا ما تستخدم الأشكال المتنوعة للمعامل، بواسطة محركات البحث كأداة مركزية في لتقييم وترتب الوثائق حسب الصلة وفقا لاستعلام المستخدم.
واحدة من أبسط دوال الترتيب تحسب بواسطة جمع المعامل لكل مصطلح من مصطلحات الاستعلام؛ الكثير من دوال الترتيب الأكثر تطورا هوشكل من أشكال هذا النموذج البسيط.
مراجع
- ^ Probability estimates in practicein Introduction to Information Retrieval. نسخة محفوظة 14 فبراير 2017 على مسقط واي باك مشين.
- ^ "TFIDF statistics | SAX-VSM". مؤرشف من الأصل في 07 نوفمبر 2017.
- ^ Bollacker, Kurt D.; Lawrence, Steve; Giles, C. Lee (1998-01-01). "CiteSeer: An Autonomous Web Agent for Automatic Retrieval and Identification of Interesting Publications". Proceedings of the Second International Conference on Autonomous Agents. New York, NY, USA: ACM: 116–123. doi:10.1145/280765.280786. ISBN . مؤرشف من الأصل في ثلاثة فبراير 2020.
تاريخ النشر:
2020-06-01 22:14:10
التصنيفات: علم المكتبات, معالجة اللغات الطبيعية, نموذج فضاء المتجه, قالب أرشيف الإنترنت بوصلات واي باك, بوابة إحصاء/مقالات متعلقة, بوابة تقنية المعلومات/مقالات متعلقة, بوابة علم الحاسوب/مقالات متعلقة, جميع المقالات التي تستخدم شريط بوابات, جميع مقالات البذور, بذرة حاسوب
التصنيفات: علم المكتبات, معالجة اللغات الطبيعية, نموذج فضاء المتجه, قالب أرشيف الإنترنت بوصلات واي باك, بوابة إحصاء/مقالات متعلقة, بوابة تقنية المعلومات/مقالات متعلقة, بوابة علم الحاسوب/مقالات متعلقة, جميع المقالات التي تستخدم شريط بوابات, جميع مقالات البذور, بذرة حاسوب