تمييز الكلام

عودة للموسوعة

تمييز الكلام

The display of the Speech Recognition screensaver on a PC, in which the character responds to questions, e.g. "Where are you?" or statements, e.g. "Hello."

مقدمة

أثار موضوع القابلات التخاطبية الكلامية بين الإنسان والآلة، منذ قرابة خمسة عقود، اهتمام المهندسين وفهماء الكلام معاً. ذلك لأن الكلام هوكيفية التواصل الأسهل والأكثر طبيعية بين البشر منذ عشرات القرون. وتسمح مثل هذه القابلات للسواد من الناس، بالتواصل مع الشبكات الحاسوبية والحصول على المعلومات دون الحاجة إلى حتىقد يكونوا معلوماتيين. وتتطلب هذه القابلات تقنيات إنتاج الكلام من الحواسيب (هجريب الكلام)، وفهم الآلة الكلام أوتعهد الكلام speech recognition.

ولتعرّف الكلام تطبيقات كثيرة مثل: إعطاء أوامر صوتية وتحكمية كطلب هتف رقم صوتياً، إدخال معطيات صوتية مثل رقم بطاقة الائتمان، إعداد وثائق بنيوية كالوثائق الطبية...وغيرها الكثير.

يُعد تعرّف الكلام إجرائية تُحوِّل الإشارة الصوتية، الملتَقَطة من هاتف أوميكرفون إلى مجموعة حدثات؛ قد تكون هذه الحدثات هي النتيجة المرجوة النهائية، كما في التطبيقات المذكورة سابقاً، وقد تخدم كدخل إلى نظم معالجة لغوية لاحقة للحصول على فهم الكلام لإعطاء تفسير لهذا الكلام والتصرف على أساسه. وقد صار لدينا خوارزميات ونظم تعهد كلام عالية الأداء.


موسطات عملية تعهد الكلام

ثمة كثير من الموسطات parameters التي تميز نظم التعهد المتنوعة:

1ـ طريقة لفظ الكلام: نميز بين نظم تعهد الحدثات المعزولة (مجموعة مفردات) حيث يتوقف المتحدث عن الكلام برهة بين حدثة وأخرى، ونظم تعهد الحدثات المتصلة (مثل أرقام الهواتف) التي لا تتطلب مثل هذا التوقف، ونظم تعهد الكلام العفوي والارتجالي الذي يتضمن مفردات واسعة وانقطاعات في السلاسة، وهوأصعب من النظم السابقة.

2ـ حجم المفردات المتنوعة التي يمكن حتى يتعهدها النظام: صغير (حتى مئة مفردة)، متوسط (يصل إلى 1000 مفردة)، واسع (يزيد على 1000 مفردة).

3ـ علاقة النظام بالمتحدثين: يمكن حتى نميز ثلاثة أنواع من نظم التعهد: نظم مرتبطة بالمتحدث، وهي تتطلب إدخال عينات من كلام جميع مستخدم جديد، نظم مستقلة عن المتحدث speaker independent لا تتطلب العملية السابقة، ونظم متكيفة مع المتحدث قادرة على تحسين أدائها بالنسبة لكل متحدث على حدة في أثناء استخدامه للنظام، مع مرور الزمن.

4ـ مقدار الفهم الصوتية والمعجمية في نظم التعهد: تراوح من نظم بسيطة لا تتضمن أي معلومات لغوية إلى نظم معقدة تكامل الفهم الصوتية واللغوية النحوية والدلالية والسياقية.

نحتاج لتعهد الكلام المستمر، إلى نماذج لغوية وقواعد صنعية لتقييد تراكب الحدثات. يمكن حتىقد يكون النموذج اللغوي بسيطاً، مثل شبكة حالات منتهية، بحيث نصرح عن الحدثات التي يمكن حتى تتلوحدثة معينة. أوحتىقد يكون أكثر عمومية، بحيث نقترب من اللغة الطبيعية باستعمال قواعد حساسة للسياق. يمكن قياس صعوبة هذه المهمة بموسط يسمى الإرباك perplexity، ويعهد على أنه المتوسط الهندسي لعدد الحدثات التي يمكن حتى تلي حدثة معينة، بعد تحديد النموذج اللغوي.

صعوبات تعرّف الكلام وحلولها

تكمن صعوبة مسألة تعهد الكلام في تنوع شكل الإشارة الكلامية الموافقة للحدثة نفسها، ويمكن تصنيف هذه التغيرات كما يأتي:

1ـ تغيرات تتعلق بالمتحدث نفسه: إذ يمكن حتى تنشأ تغيرات صوتية بحسب تغيرات الحالة الفيزيولوجية والنفسية للشخص (هل هومريض أوسليم، حزين أوفرح أوغاضب...)، وبحسب معدل كلامه (سريع أوبطيء)، وبحسب جودة صوته (يقصد الإفهام أويتحدث على نحوعارض).

2ـ تغيرات بين المتحدثين: تتبع الخلفية الاجتماعية ـ اللغوية لهم مثل، اللهجة وأبعاد وشكل جهازهم الصوتي الفيزيولوجي vocal tract.

3ـ التحقيق الصوتي للصوتيمات phonemes: وهي أصغر الوحدات الصوتية التي يمكن حتى تهجرب منها الحدثات، ويعتمد هذا التحقيق اعتماداً كبيراً على السياق الذي تُلفَظ فيه. على سبيل المثال، يختلف لفظ الصوت /ب/ من الحدثة «باب» إلى الحدثة «سبت»، فهوفي الأولى /b/ وفي الثانية /p/.

4ـ اختلاف محيط المتحدث: وهذا ناتج عن وجود إشارات صوتية غير مرغوب فيها (متحدثين آخرين، ضجيج، إغلاق باب...)، أوعن تنوع الميكرفونات المستخدمة ومكان توضعها.

توجد عدة نماذج لنظم تعهد الكلام منها النموذج الأكثر استخداماً تجارياً وصناعياً؛ وذلك لأنه يصلح مهما تغيرت المفردات أوتبدل المتحدثون أومجموعة موسطات التمثيل أوخوارزمية البحث، وكذلك لسهولة برمجته وأدائه الجيد. ويستخدم هذا النموذج للتعهد على الحدثات المعزولة والمتصلة. يبين الشكل الآتي المكونات النموذجية لمثل هذا النظام:

يُعمد في البدء إلى تحليل الإشارة الكلامية بهدف تحويلها إلى تمثيل مضغوط قادر على تمييز الخصائص properties المتغيرة مع الزمن للكلام (موسطات ترددية أومعاملات ترميز التنبؤ الخطي أوغيرها، تحسب على نوافذ زمنية 10-30 ms بسبب الطبيعة المتغيرة للكلام)، أوإلى توصيف إحصائي لتسلسل الأصوات المتنوعة ضمن الحدثات (نموذج ماركوڤ المخفي Hidden Markov Model (HMM).

يتطلب هذا النموذج عملية تدريب تسبق عملية التعهد يجري ضمنها استخلاص سمات مرجعية للمفرادت التي نرغب في تعهدها. من أجل التعهد على مفردة ما نعمد إلى موازنة سماتها مع السمات المرجعية لجميع المفردات المرجعية للبحث على المفردة الأقرب إليها. وللحصول على تعهد أمثل يمكن الإفادة من التقييدات الصوتية والمعجمية والنماذج اللغوية للغة المستعملة.

من الجدير بالذكر حتى هناك طرق أخرى للتعهد تعتمد على تحديد البتر الصوتية وتصنيفها ثم استعمالها للتعهد على الحدثات، وذلك بالاستفادة من تقانات الذكاء الصنعي التي تحاول تقليد عملية تعرّف الكلام عند البشر. كما يمكن استعمال تقانة الشبكات العصبونية في التعهد مع نموذج ماركوڤ المخفي المشار إليه سابقاً.

تحاول نظم تعهد الكلام، نمذجة مصادر التغييرات المذكورة سابقاً، على عدة مستويات. عملى مستوى تمثيل الإشارة، طور الباحثون طرق تمثيل تؤكد السمات الحسية الهامة للإشارة الكلامية، المستقلة عن المتحدث، وتخفف من أثر الصفات المعتمدة على المتحدث. وعلى المستوى الصوتي، جرت نمذجة تغييرات المتحدث باستعمال تقنيات إحصائية مطبَّقة على كم هائل من المعطيات. وكذلك، جرى تطوير خوارزميات مواءمة المتحدث، تناسب النماذج الصوتية المستقلة عن المتحدث لتوائم النماذج الصوتية للمتحدث الحالي أثناء استعماله للنظام. كما جرى تدريب النظم على نماذج مختلفة لمقاطع الأصوات في سياقات مختلفة لأخذ تغيّراتها بالحسبان. أما على مستوى الحدثات، فيجري تدريب النظم على مختلف ألفاظ الحدثات وحسب لهجات متعددة، وجرى استعمال نماذج لغوية إحصائية تعتمد على تقدير تردد ورود سلاسل الحدثات لقيادة البحث عن الحدثات الأكثر احتمالاً.

الحالة الراهنة

يمكن قياس أداء نظم التعهد بمعدل الخطأ الذي يُعرَّف بالعلاقة: E=(S+I+D)*100/N حيث N هوالعدد الكلي لمفردات التعهد، S عدد الاستبدالات (تعهد حدثة مكان أخرى)، I عدد الإدراجات (تعهد حدثات غير ملفوظة أصلاً)، D عدد المحذوفات (عدم تعهد حدثة ملفوظة). وقد تطورت تقانات تعهد الكلام كثيراً في الفترة الأخيرة، وأدى هذا إلى خفض معدل الخطأ السابق بنسبة 50٪ (إلى النصف) جميع عامين تقريباً. ويعود هذا التطور إلى عدة عوامل منها:

1ـ تطور تقنيات نموذج ماركوڤ المخفي HMM التي تساعد على الحصول على أداء أفضل بعد معالجة معطيات التدريب آلياً.

2ـ الجهود المبذولة عالمياً لبناء مدونات قياسية ضخمة، لتطبيقات الكلام، ولعدد من اللغات العالمية.

3ـ تقييس تقويم أداء مختلف نظم التعهد، وهذا ما زاد في وثوقية مراقبة تطور هذه النظم.

4ـ أثر التطور الحاصل في مجال التقانات الحاسوبية تأثيراً غير مباشر في تطور هذا الفهم. فحواسيب اليوم أسرع من سابقاتها، وأرخص ثمناً وأكثر سعة.

يزداد الاهتمام، اليوم، بنظم التعهد عبر الشبكات الهاتفية والخلوية، حيث يزيد معدل تعهد الحدثات عبر المحادثات الهاتفية على 50٪.

فيما يأتي بعض أسماء نظم تعهد الكلام:

ـ تحت نظام ماكنتوش:

Dragon Dictation Products

ـ تحت نظام وندوز (ومنها وندوز 95 وNT و3.1(:

AT&T Watson Speech Recognition

Cambridge Voice for Windows

  • DragonDictate for Windows

ـ تحت نظام دوس

DATAVOX - French

Dragon Developer Tools

ـ تحت النظام Unix AbbotDemo * BBN Hark Telephony Recognizer * EARS: Single Word Recognition Package*Hidden Markov Model Toolkit (HTK) from Entropic

يختلف أداء نظم التعهد بحسب التطبيق والتقانات المستعملة، وفيما يأتي مثالان عن أداء هذه النظم:

ـ نظام تعهد الأرقام باللغة الإنجليزية، مستقل عن المتحدث، الأرقام ملفوظة على نحومستمر وبعرض حزمة هاتفية، معامل الإرباك 11. معدل الخطأ 0.3٪ حينقد يكون عدد الأرقام في السلسلة معروفاً.

- نظام تعهد لأغراض الإملاء، حجم المفردات يتجاوز 20000، معامل الإرباك نحو200، لكلام مستمر، مستقل عن المتحدث، كان معدل الخطأ في عام 1994 نحو7.2٪.


التوجهات المستقبلية ومجالات البحث

إن محاور البحث الآتية يمكن حتى تزيد من أداء نظم تعهد الكلام:

1ـ المتانة والمناعة: عدم تأثر أداء النظام كثيراً حين تتغير حالات استثماره عن حالات تدريبه.

2ـ الحَمُولة: عدم الحاجة إلى إعادة تدريب النظم مع اختلاف التطبيقات، لأن الأمر مكلف مادياً وزمانياً.

3ـ نمذجة اللغة: وضع قيود على النماذج اللغوية، مثل القيود النحوية syntactic والدلالية semantic التي لا يمكن نمذجتها بنماذج إحصائية بحتة.

4ـ حدثات من خارج المفردات: تمكين النظام من اكتشاف الحدثات الجديدة من خارج المفردات، بحيث لا تسبب الحدثة الجديدة الخطأ.

5ـ الكلام العفوي: القدرة على التعامل مع مختلف ظواهر الكلام العفوي مثل، إضافة توقفات، أخطاء، بنى غير قواعدية، تردد وإحجام.

6ـ نمذجة الحركة الديناميكية للعضلات الكلامية: كيف من الممكن أن ننمذجها ونكاملها ضمن نظام التعهد.

التطبيقات

الرعاية الصحية

العسكرية

الطائرات المقاتلة عالية الأداء

المروحيات

معركة إدارة

تدريب المراقبين الجويين

الاتصالات الهاتفية وغيرها من المجالات

تطبيقات أخرى

  • Aerospace (e.g. space exploration, spacecraft, etc.) NASA’s Mars Polar Lander used speech recognition from technology Sensory, Inc. in the Mars Microphone on the Lander
  • Automatic translation
  • Automotive speech recognition (e.g., OnStar, Ford Sync)
  • Court reporting (Realtime Speech Writing)
  • Hands-free computing: Speech recognition computer user interface
  • Home automation
  • Interactive voice response
  • Mobile telephony, including mobile email
  • Multimodal interaction
  • Pronunciation evaluation in computer-aided language learning applications
  • Robotics
  • Speech-to-text reporter (transcription of speech into text, video captioning, Court reporting )
  • Telematics (e.g., vehicle Navigation Systems)
  • Transcription (digital speech-to-text)
  • Video games, with Tom Clancy's EndWar and Lifeline as working examples

الأداء

ملف:Neural network.png
Neural Network

Accuracy of speech recognition

Digitized Sound Graph


Dictation

الخوارزميات

نماذج ماركوڤ المخفية

Dynamic time warping (DTW)-based speech recognition

معلومات أخرى

أشخاص ذوي احتياجات خاصة

الأبحاث الحالية والتمويل

انظر أيضاً

  • ALPAC report
  • Automatic Language Translator
  • Articulatory speech recognition
  • Audio mining
  • Audio-visual speech recognition
  • Cache language model
  • Keyword spotting
  • Kinect
  • Microphone
  • Mondegreen
  • Multimedia Information Retrieval
  • OpenDocument
  • Phonetic search technology
  • Speaker recognition
  • Speaker diarisation
  • Speech analytics
  • Speech corpus
  • Speech interface guideline
  • Speech recognition in Linux
  • Speech synthesis including Text-to-speech (TTS)
  • Speech technology
  • Speech verification
  • VoiceXML
  • VoxForge
  • Windows Speech Recognition

المصادر

  • Karat, Clare-Marie; Vergo, John; Nahamoo, David (2007). "Conversational Interface Technologies". In Sears, Andrew; Jacko, Julie A. (eds.). The Human-Computer Interaction Handbook: Fundamentals, Evolving Technologies, and Emerging Applications (Human Factors and Ergonomics). Lawrence Erlbaum Associates Inc. ISBN .
  • Managing editors: Giovanni Battista Varile, Antonio Zampolli. (1997). Cole, Annie; Mariani, Joseph; Uszkoreit, Hans; Varile, Giovanni Battista; Zaenen; Zampolli; Zue (eds.). Survey of the state of the art in human language technology. Cambridge Studies In Natural Language Processing. XII–XIII. Cambridge University Press. ISBN . More than one of |editor1-first= and |editor-first= specified (help); More than one of |editor3-given= and |editor3-first= specified (help); More than one of |editor4-given= and |editor4-first= specified (help)
  • Junqua, J.-C.; Haton, J.-P. (1995). Robustness in Automatic Speech Recognition: Fundamentals and Applications. Kluwer Academic Publishers. ISBN .
  1. ^ أميمة الدكاك. "تعرّف الكلام". الموسوعة العربية.
  2. ^ The Planetary Society. “[1].” .

وصلات خارجية

  • Speech Technology at the Open Directory Project

تاريخ النشر: 2020-06-04 19:41:19
التصنيفات: صفحات تحوي وصلات ملفات معطوبة, Articles lacking in-text citations from July 2009, Articles with invalid date parameter in template, All articles lacking in-text citations, Pages with citations having redundant parameters, CS1: long volume value, تعرف آلي والتقاط البيانات, تمييز الكلام, تقنيات واجهة المستخدم, تاريخ التفاعل بين الإنسان والحاسوب, Computational linguistics, Computer accessibility

مقالات أخرى من الموسوعة

سحابة الكلمات المفتاحية، مما يبحث عنه الزوار في كشاف:

آخر الأخبار حول العالم

اكتشاف سعودي لعلاج الشيخوخة وسرطان الغدد اللمفاوية السعودية

المصدر: جريدة الوطن - السعودية التصنيف: إقتصاد
تاريخ الخبر: 2023-04-09 06:25:19
مستوى الصحة: 58% الأهمية: 58%

روائح الإناث تنقص وزن الذكور السعودية

المصدر: جريدة الوطن - السعودية التصنيف: إقتصاد
تاريخ الخبر: 2023-04-09 06:25:10
مستوى الصحة: 52% الأهمية: 62%

«مقابلة مع السيد آدم 2»: الغموض بين الجاذبية والنفور

المصدر: ألشرق الأوسط - السعودية التصنيف: سياسة
تاريخ الخبر: 2023-04-09 06:24:53
مستوى الصحة: 78% الأهمية: 94%

المخللات تزيد خطر الوفاة السعودية

المصدر: جريدة الوطن - السعودية التصنيف: إقتصاد
تاريخ الخبر: 2023-04-09 06:25:16
مستوى الصحة: 45% الأهمية: 61%

وهج الشاشة يهجّر مسرحيين للدراما السعودية

المصدر: جريدة الوطن - السعودية التصنيف: إقتصاد
تاريخ الخبر: 2023-04-09 06:25:20
مستوى الصحة: 59% الأهمية: 50%

شح المياه... كابوس يهدد دول المغرب العربي بالعطش

المصدر: ألشرق الأوسط - السعودية التصنيف: سياسة
تاريخ الخبر: 2023-04-09 06:24:54
مستوى الصحة: 81% الأهمية: 100%

Microsoft تدفع 3 ملايين دولار لأمريكا السعودية

المصدر: جريدة الوطن - السعودية التصنيف: إقتصاد
تاريخ الخبر: 2023-04-09 06:25:07
مستوى الصحة: 45% الأهمية: 58%

إصلاح ثغرتين لاختراق أجهزة Apple السعودية

المصدر: جريدة الوطن - السعودية التصنيف: إقتصاد
تاريخ الخبر: 2023-04-09 06:25:21
مستوى الصحة: 55% الأهمية: 58%

سلطان بروناي دار السلام يصل جدة - أخبار السعودية

المصدر: صحيفة عكاظ - السعودية التصنيف: مجتمع
تاريخ الخبر: 2023-04-09 06:24:58
مستوى الصحة: 49% الأهمية: 68%

اليوم.. تعليق الدراسة الحضورية في تعليم وجامعتي الطائف وبيشة

المصدر: اليوم - السعودية التصنيف: سياسة
تاريخ الخبر: 2023-04-09 06:26:48
مستوى الصحة: 49% الأهمية: 63%

علماء يكتشفون «وحشاً غير مرئي هارباً في الفضاء» - أخبار السعودية

المصدر: صحيفة عكاظ - السعودية التصنيف: مجتمع
تاريخ الخبر: 2023-04-09 06:24:59
مستوى الصحة: 50% الأهمية: 61%

بدءًا من الثلاثاء.. 4200 معتكف يقضون العشر الأواخر في المسجد النبوي

المصدر: اليوم - السعودية التصنيف: سياسة
تاريخ الخبر: 2023-04-09 06:26:42
مستوى الصحة: 47% الأهمية: 64%

تغيير مواعيد النوم يضر القلب السعودية

المصدر: جريدة الوطن - السعودية التصنيف: إقتصاد
تاريخ الخبر: 2023-04-09 06:25:08
مستوى الصحة: 56% الأهمية: 70%

الأرصاد: أمطار خفيفة إلى متوسطة على مكة وجدة وعسير - أخبار السعودية

المصدر: صحيفة عكاظ - السعودية التصنيف: مجتمع
تاريخ الخبر: 2023-04-09 06:24:56
مستوى الصحة: 60% الأهمية: 55%

عكاظ تنشر تفاصيل مفاضلة النقل الخارجي للمعلمين - أخبار السعودية

المصدر: صحيفة عكاظ - السعودية التصنيف: مجتمع
تاريخ الخبر: 2023-04-09 06:24:55
مستوى الصحة: 59% الأهمية: 57%

رئيسة الهند تحلّق على متن مقاتلة «سو-30 م ك ي» - أخبار السعودية

المصدر: صحيفة عكاظ - السعودية التصنيف: مجتمع
تاريخ الخبر: 2023-04-09 06:25:00
مستوى الصحة: 46% الأهمية: 66%

الرئيس الفرنسي يختتم زيارته الى الصين على وقع الإهانة والسخرية

المصدر: موقع الدار - المغرب التصنيف: مجتمع
تاريخ الخبر: 2023-04-09 06:25:57
مستوى الصحة: 46% الأهمية: 50%

دب يقتل شابا بوحشية السعودية

المصدر: جريدة الوطن - السعودية التصنيف: إقتصاد
تاريخ الخبر: 2023-04-09 06:25:12
مستوى الصحة: 53% الأهمية: 54%

حسين فهمي لـ«الشرق الأوسط»: البعض يترصد خالد يوسف

المصدر: ألشرق الأوسط - السعودية التصنيف: سياسة
تاريخ الخبر: 2023-04-09 06:24:51
مستوى الصحة: 82% الأهمية: 100%

بيانات كوكب انفجر قبل 340 عاما السعودية

المصدر: جريدة الوطن - السعودية التصنيف: إقتصاد
تاريخ الخبر: 2023-04-09 06:25:14
مستوى الصحة: 46% الأهمية: 51%

إسرائيل تشن غارات على سوريا رداً على إطلاق صواريخ

المصدر: ألشرق الأوسط - السعودية التصنيف: سياسة
تاريخ الخبر: 2023-04-09 06:24:44
مستوى الصحة: 85% الأهمية: 89%

مشروعات جديدة لوزارة التجارة 10 السعودية

المصدر: جريدة الوطن - السعودية التصنيف: إقتصاد
تاريخ الخبر: 2023-04-09 06:25:22
مستوى الصحة: 47% الأهمية: 50%

pendik escort
betticket istanbulbahis zbahis
1xbetm.info betticketbet.com trwintr.com trbettr.info betkom
Turbanli Porno lezbiyen porno
deneme bonusu
levant casino levant casino levant casino levant casino levant casino levant casino
bodrum escort
deneme bonusu veren siteler
Bedava bonus casino siteleri ladesbet
deneme bonusu veren siteler
deneme bonusu
deneme bonusu
sex ki sexy
deneme bonusu
kargabet
تحميل تطبيق المنصة العربية