أي حرف مخفي؟ التعرف على الحروف الأبجدية التعرف على الحروف الشبكات العصبية ج

24.10.2020

دعونا نمتلك شاشة أمامنا، مقسمة إلى اثنتي عشرة خلية، 4 × 3. تعكس الخلايا تباين عناصر الصورة. عند تركيز الصورة، تكون الخلية إما مضاءة أم لا. تحدد "الإضاءة" قيمة واحدة لحجم الإثارة، "عدم التعرض" - صفر. وبالتالي، فإن الحرف O يحدد إضاءة الخلايا، المحددة في الشكل. 2.1. يضيء الحرف A الشاشة، كما هو موضح في الشكل 2.2.

ما الذي يجب فعله حتى يتمكن بعض الأجهزة التي نقوم بتصميمها من معرفة الحرف الذي هو عليه؟

من الواضح أن جميع الإشارات الخاصة بإثارة خلايا الشاشة، المضاءة بالحرف O، يجب إرسالها إلى الموصل الذي ينفذ الدائرة I، وستكون هناك إشارة واحدة عند خرج الموصل، كما هو موضح في الشكل 2.1 يتم إنشاؤه إذا وحينها فقط عندما تكون جميع خلايا الشاشة التي توضع عليها الصورة مضاءة بالحرف O. إن وجود إشارة واحدة عند مخرج الملتحمة سيحدد الإجابة: "هذا هو الحرف O".


أرز. 2.1.تعليم حرف "O"


أرز. 2.2.تعليم حرف "أ"

ويجب أن يتم نفس الشيء بالنسبة للحرف A.

لنضع علامة على كل خلية في الشاشة بإحداثياتها. بعد ذلك، بلغة المنطق الرياضي، يمكن كتابة ما فعلناه في شكل عبارات منطقية - المسندات:

تحدد هذه المسندات التجسيد "الإلكتروني" باستخدام طرق تصميم الدوائر.

في هذه الحالة، لن "تتداخل" الحروف مع بعضها البعض، نظرًا لأن إضاءة خلايا الشاشة المقابلة لا تتزامن جزئيًا، وسيتم تحديد قيمة وحدة الاقتران لواحدة منها فقط.

ماذا لو وضعت حرف K على الشاشة؟ ثم لن ينتج أي من الملتحمين قيمة واحدة، لأنه لن يكون هناك مصادفة كاملة لإضاءة خلايا الشاشة المقابلة. "لتعليم" النظام الحرف K، تحتاج إلى إدخال أداة ربط أخرى والقيام بنفس الإنشاءات المذكورة أعلاه.

وبالتالي، يمكننا القول أننا قمنا ببناء نظام للتعرف على حرفين معطىين "بشكل صحيح".

ولكن ماذا تفعل إذا كانت الحروف التي تظهر على الشاشة مكتوبة بيد مرتجفة؟ ثم يجب أن نسمح بإضاءة بديلة لبعض الخلايا المجاورة للشاشة ونأخذ ذلك في الاعتبار باستخدام عملية الفصل، OR. وكما هو معروف، نتيجة لهذه العملية، يتم إنشاء إشارة واحدة إذا كان هناك إشارة واحدة على الأقل عند الإدخال.

ولننظر في إمكانية التعرف على حرف O، مما يسمح بإمكانية إضاءة الخلايا (1،1)، (1،3)، (4،1)، (4،3). بعد ذلك سوف يأخذ المسند الذي تم إنشاؤه مسبقًا النموذج:

وبالمثل، بالنسبة للحرف A، دعونا نسمح بإضاءة الخلايا (4،1) و (4،3):


أرز. 2.3.التعليم المشترك لحرف "O" و "A"

من خلال الجمع بين كلا المسندين، نحصل على الرسم البياني في الشكل 2.3.

وهكذا، قمنا بتنفيذ نهج "الدوائر" للتعلم والاعتراف، على أساس استخدام الوظائف المنطقية والتشغيل المتغيرات المنطقية 0, 1.

بناء شبكة عصبية منطقية مدربة على التعرف على الحروف

الآن دعونا نتخذ هذه الخطوة، ذلك التحول، الذي يحدد البساطة البارعة للتجسيد الطبيعي، المصمم للبيانات غير المكتملة، وعدم الموثوقية، و"الضوضاء"، ومتطلبات السرعة العالية، والموثوقية العالية والتوحيد. لأننا لا نستطيع أن نتصور دائرة إلكترونية مخبأة في الجمجمة.

الطبيعة ونحن، كجزء منها، لا نمتلك أبدًا معلومات دقيقة ومحددة وموثوقة. إن إضاءة خلايا الشاشة، مثل مستقبلات أعيننا، لا تكتمل أبدًا، والصورة ليست صحيحة أبدًا، وهناك ضوضاء، وسهو، وما إلى ذلك. ثم تكتسب مفاهيم التشابه والارتباطات أهمية حيوية. "ما هو الأكثر تشابهًا مع الصورة "المعروضة" ، والموقف الذي نشأ ، وما هي إجراءات الاستجابة الأكثر تبريرًا؟ " - هذا هو السؤال الذي يحدد مبدأ حياتنا من بين العديد من المخاطر والإنجازات. إن ترابط تفكيرنا مطلق.

وهذا يعني أننا بحاجة إلى الابتعاد عن المتغيرات المنطقية المحددة جيدًا (0، 1، "نعم - لا"، "أبيض - أسود"، وما إلى ذلك) نحو عدم اليقين أو الموثوقية أو التقييمات الأخرى للمعلومات - نحو المتغيرات الحقيقية.

ولكن بعد ذلك من الضروري الابتعاد عن الجبر البولي، حيث لم يتم تعريف مفاهيم الاقتران والانفصال للمتغيرات الحقيقية. هذا هو المكان الذي يأتي فيه تحليل وتطبيق مبادئ التنفيذ الطبيعي للإنقاذ - مبادئ الشبكة العصبية المتجسدة في دماغنا.

دعونا نحول الدائرة المدربة التي تلقيناها إلى شبكة عصبية (الشكل 2.4).

كل خلية في الشاشة عبارة عن خلية عصبية مستقبلة، والتي، نتيجة للإضاءة، تكتسب قدرًا معينًا من الإثارة، وتأخذ قيمة تتراوح بين صفر وواحد. المستقبلات التي تحل محل الشاشة تشكل المدخلات، أو طبقة المستقبلاتالشبكات العصبية. سنقوم باستبدال كل رابط ومفصل بنموذج عصبي واحد للشبكة بأكملها. دعونا نقدم طبقة الإخراج للشبكة، والتي تتكون في مثالنا من خليتين عصبيتين، يحدد إثارةهما نتيجة التعرف. لنقم بتسمية الخلايا العصبية لطبقة الإخراج بأسماء الحروف - O و A.

المستقبلات، مثل الشاشة، متحمسة من الخارج. ومع ذلك، تقوم خلايا عصبية أخرى، بتقليد انتشار الإثارة في الدماغ، بالتنفيذ وظيفة النقل(من حيث نظرية التحكم الآلي) أو وظيفة التنشيط(من حيث نظرية الشبكة العصبية). تقوم هذه الوظيفة بتحويل الإشارات عند مدخلات الخلية العصبية، مع الأخذ في الاعتبار أوزان هذه المدخلات (سنؤجل النظر فيها الآن)، إلى قيمة إثارة هذه الخلية العصبية، التي تنتقل عبر الشبكة وفقًا للاتصالات من الخلايا العصبية والوصول إلى خلية عصبية واحدة أو أكثر من طبقة الإخراج.


أرز. 2.4.شبكة عصبية للتعرف على الحروف "O" و"A"

حيث يتم تقليد عمل الدماغ المستوى المنطقي, وظيفة التنشيطالاختيار بسيط للغاية. لذلك، في مثالنا يكفي تحديد ما يلي وظيفة التنشيطللعثور على قيمة الإثارة للخلية العصبية i:

في البداية نجد

ثم نضع

هذا المشروع لا يدعي أنه المركز الأول في العالم ولا يعتبر منافسا FineReaderلكني آمل أن تكون فكرة التعرف على أنماط الأحرف باستخدام خاصية أويلر جديدة.

مقدمة لخاصية أويلر للصورة.

الفكرة الأساسية هي أن تلتقط صورة بالأبيض والأسود، وبافتراض أن 0 هو بكسل أبيض و1 هو بكسل أسود، فإن الصورة بأكملها ستكون عبارة عن مصفوفة من الأصفار والواحدات. في هذه الحالة، يمكن تمثيل صورة بالأبيض والأسود كمجموعة من الأجزاء بقياس 2 × 2 بكسل؛ يتم عرض جميع المجموعات الممكنة في الشكل:

على كل صورة الموافقة المسبقة عن علم 1، الموافقة المسبقة عن علم 2،... يُظهر مربعًا أحمر لخطوة العد في الخوارزمية، بداخله إحدى الأجزاء فمن الصورة أعلاه. في كل خطوة، يتم جمع كل جزء، مما يؤدي إلى صورة إبداعينحصل على المجموعة: ومن الآن فصاعدا ستسمى خاصية أويلر للصورة أو المجموعة المميزة.


تعليق:ومن الناحية العملية، لا يتم استخدام القيمة F0 (بالنسبة للصورة الأصلية، هذه القيمة هي 8)، لأنها خلفية الصورة. ولذلك سيتم استخدام 15 قيمة، بدءاً من F1 إلى F15.

خصائص خاصية أويلر للصورة.

  1. قيمة مجموعة الخصائص فريدة من نوعها، بمعنى آخر، لا توجد صورتان لهما نفس خاصية أويلر.
  2. لا توجد خوارزمية للتحويل من مجموعة مميزة إلى الصورة الأصلية؛ الطريقة الوحيدة هي القوة الغاشمة.

ما هي خوارزمية التعرف على النص؟

فكرة التعرف على الحروف هي أننا نقوم بحساب خاصية أويلر مسبقًا لجميع الحروف في أبجدية اللغة وتخزينها في قاعدة المعرفة. ثم سنقوم بحساب خاصية أويلر لأجزاء الصورة المتعرف عليها والبحث عنها في قاعدة المعرفة.

مراحل الاعتراف:

  1. يمكن أن تكون الصورة إما أبيض وأسود أو ملونة، لذا فإن المرحلة الأولى هي تقريب الصورة، أي الحصول على الأبيض والأسود منها.
  2. نقوم بتمرير بكسل تلو الآخر عبر الصورة بأكملها للعثور على وحدات البكسل السوداء. عند اكتشاف بكسل مظلل، يتم إطلاق عملية متكررة للبحث عن جميع وحدات البكسل المظللة المجاورة للبكسل الموجود والوحدات اللاحقة. ونتيجة لذلك، سنتلقى جزءًا من الصورة، والذي يمكن أن يكون إما شخصية كاملة أو جزءًا منها، أو "قمامة" يجب التخلص منها.
  3. بعد العثور على جميع الأجزاء غير المتصلة من الصورة، يتم حساب خاصية أويلر لكل منها.
  4. بعد ذلك، يبدأ تشغيل المحلل، ومن خلال مراجعة كل جزء، يحدد ما إذا كانت قيمة خاصية أويلر الخاصة به موجودة في قاعدة المعرفة. فإذا وجدنا القيمة نعتبرها جزءًا معروفًا من الصورة، وإلا فإننا نتركها لمزيد من الدراسة.
  5. تخضع الأجزاء غير المعترف بها من الصورة للتحليل الإرشادي، أي أنني أحاول العثور على أكثرها قيمة مناسبةفي قاعدة المعرفة. إذا لم يكن من الممكن العثور عليه، فستتم محاولة "لصق" الأجزاء القريبة والبحث عن نتيجة لها في قاعدة المعرفة. ما هو "الإلتصاق"؟ الحقيقة هي أنه ليست كل الحروف تتكون من صورة واحدة متصلة، على سبيل المثال "!" تحتوي علامة التعجب على جزأين (عصا ونقطة)، لذا قبل البحث عنها في قاعدة المعرفة، تحتاج إلى حساب القيمة الإجمالية لخاصية أويلر من كلا الجزأين. إذا، حتى بعد الإلتصاق بالقطاعات المجاورة، لا يمكن العثور على نتيجة مقبولة، فإننا نعتبر الجزء قمامة وتخطيه.

تكوين النظام:

  1. قاعدة المعرفة- ملف أو ملفات تم إنشاؤها في الأصل بواسطتي أو بواسطة شخص آخر، وتحتوي على مجموعات أحرف مميزة ومطلوبة للتعرف عليها.
  2. جوهر- يحتوي على الوظائف الأساسية التي تؤدي التعرف
  3. مولد- وحدة لإنشاء قاعدة المعرفة.

ClearType ومكافحة التعرجات.

لذلك، كمدخل لدينا صورة يمكن التعرف عليها، والهدف هو جعلها بالأبيض والأسود، مناسبة لبدء عملية التعرف. قد يبدو أن ما يمكن أن يكون أبسط هو أننا نحسب جميع وحدات البكسل البيضاء على أنها 0، وكل الباقي على أنه 1، ولكن ليس كل شيء بهذه البساطة. يمكن أن يكون النص الموجود في الصورة مصقولًا أو غير مصقول. تبدو الأحرف المصقولة سلسة وبدون زوايا، بينما ستظهر الأحرف غير المصقولة على الشاشات الحديثة مع وحدات بكسل مرئية على طول المخطط التفصيلي. مع ظهور شاشات LCD (البلورية السائلة)، تم إنشاء ClearType (لنظام التشغيل Windows) وأنواع أخرى من الصقل، والتي استفادت من ميزات مصفوفة الشاشة. تتغير ألوان بكسلات الصورة النصية، وبعد ذلك تبدو "أكثر نعومة". لرؤية نتيجة التجانس، يمكنك كتابة بعض الحروف (أو النص)، على سبيل المثال في com.mspaint، قم بالتكبير، وتحول النص الخاص بك إلى نوع من الفسيفساء متعددة الألوان.

ماذا جرى؟لماذا نرى رمزا عاديا على نطاق صغير؟ هل عيوننا تخدعنا؟ والحقيقة هي أن بكسل شاشة LCD لا يتكون من بكسل واحد يمكنه استقبال اللون المطلوب، بل من 3 بكسلات فرعية من 3 ألوان، وهي كافية للحصول على اللون المطلوب. ولذلك، فإن هدف ClearType هو الحصول على النص الأكثر إمتاعًا من الناحية المرئية باستخدام ميزة مصفوفة شاشة LCD، ويتم تحقيق ذلك باستخدام عرض البكسل الفرعي. يمكن لأي شخص لديه "عدسة مكبرة" لغرض التجربة تكبير أي مكان على الشاشة قيد التشغيل ورؤية المصفوفة كما في الصورة أدناه.

يوضح الشكل مربعًا بحجم 3 × 3 بكسل لمصفوفة LCD.

انتباه!تعمل هذه الميزة على تعقيد عملية الحصول على صورة بالأبيض والأسود وتؤثر بشكل كبير على النتيجة، لأنها لا تتيح دائمًا الحصول على نفس الصورة، التي يتم حفظ خاصية أويلر الخاصة بها في قاعدة المعرفة. وبالتالي، فإن الاختلاف في الصور يفرض إجراء تحليل إرشادي، والذي قد لا يكون ناجحًا دائمًا.


الحصول على صورة بالأبيض والأسود.

لم أكن راضيًا عن جودة خوارزميات تحويل الألوان إلى الأبيض والأسود الموجودة على الإنترنت. بعد تطبيقها، أصبحت صور الشخصيات الخاضعة لعرض البكسل الفرعي مختلفة في العرض، وظهرت فواصل في سطور الحروف وظهرت قمامة غير مفهومة. ونتيجة لذلك، قررت الحصول على صور بالأبيض والأسود من خلال تحليل سطوع البكسل. تم اعتبار جميع وحدات البكسل الأكثر سطوعًا (أكبر من القيمة) 130 وحدة سوداء، والباقي أبيض. هذه الطريقة ليست مثالية، ولا تزال تؤدي إلى نتيجة غير مرضية إذا تغير سطوع النص، ولكنها على الأقل حصلت على صور مشابهة للقيم الموجودة في قاعدة المعرفة. يمكن رؤية التنفيذ في فئة LuminosityApproximator.

قاعدة المعرفة.

كانت الفكرة الأولية لملء قاعدة المعرفة هي أنه بالنسبة لكل حرف من اللغة، سأقوم بحساب خاصية أويلر لصورة الرمز الناتجة لـ 140 خطًا مثبتًا على جهاز الكمبيوتر الخاص بي (C:\Windows\Fonts)، وإضافة جميع الخطوط خيارات لأنواع الخطوط (العادية، الدهنية, مائل) والأحجام من 8 إلى 32، وبالتالي تغطي جميع أشكال الحروف والقاعدة أو جميعها تقريبًا، ستصبح عالمية، ولكن لسوء الحظ تبين أن هذا ليس جيدًا كما يبدو. بهذه الشروط هذا ما حصلت عليه:

  1. تبين أن ملف قاعدة المعرفة كبير جدًا (حوالي 3 ميغابايت) للغة الروسية و اللغة الإنجليزية. على الرغم من أن خاصية أويلر يتم تخزينها كسلسلة بسيطة مكونة من 15 رقمًا، والملف نفسه عبارة عن أرشيف مضغوط (DeflateStream)، والذي يتم بعد ذلك تفريغه في الذاكرة.
  2. يستغرق الأمر حوالي 10 ثوانٍ لإلغاء تسلسل قاعدة المعرفة. في الوقت نفسه، عانى وقت مقارنة المجموعات المميزة. لم يكن من الممكن العثور على دالة لحساب GetHashCode()، لذلك اضطررت للمقارنة شيئًا فشيئًا. وبالمقارنة بقاعدة معرفية مكونة من 3-5 خطوط، زاد وقت تحليل النص بقاعدة بيانات مكونة من 140 خطًا بمقدار 30-50 مرة. وفي الوقت نفسه، لا يتم حفظ نفس مجموعات الخصائص في قاعدة المعرفة، على الرغم من أن بعض الأحرف في خطوط مختلفة قد تبدو متشابهة ومتشابهة، حتى أن هناك، على سبيل المثال، 20 و21 خطًا.

لذلك، اضطررت إلى إنشاء قاعدة معرفية صغيرة تدخل داخل الوحدة الأساسية وتجعل من الممكن التحقق من الوظيفة. هناك مشكلة خطيرة للغاية عند ملء قاعدة البيانات. لا تعرض كافة الخطوط الأحرف الصغيرة بشكل صحيح. لنفترض أن الحرف "e" عند عرضه بحجم خط 8 المسمى "Franklin Gothic Medium" يتبين أنه:

وهو يحمل القليل من التشابه مع الأصل. علاوة على ذلك، إذا قمت بإضافته إلى قاعدة المعرفة، فهذا سيؤدي إلى تفاقم نتائج الكشف عن مجريات الأمور بشكل كبير، لأن تحليل الرموز المشابهة لهذا هو مضلل. دتم الحصول على هذا الرمز بخطوط مختلفة لأحرف مختلفة. يجب التحكم في عملية ملء قاعدة المعرفة نفسها بحيث يتم فحص كل صورة للرمز، قبل حفظها في قاعدة المعرفة، من قبل شخص للتأكد من امتثالها للحرف. لكن لسوء الحظ، ليس لدي الكثير من الطاقة والوقت.

خوارزمية البحث عن الأحرف.

سأقول على الفور أنني في البداية قللت من أهمية هذه المشكلة في البحث ونسيت أن الرموز يمكن أن تتكون من عدة أجزاء. بدا لي أنه أثناء المرور بكسلًا تلو الآخر، سأواجه رمزًا، وأبحث عن أجزائه، إن وجدت، وأجمعها وأحللها. سيبدو التمرير العادي كما يلي: أبحث عن الحرف "H" (في قاعدة المعرفة) وأعتبر أن جميع الأحرف الموجودة أسفل النقطة العلوية وفوق النقطة السفلية تنتمي إلى السطر الحالي ويجب أن تكون مستعارة معًا:

ولكن هذا هو الوضع المثالي، أثناء الاعتراف، كان علي أن أتعامل مع الصور الممزقة، والتي، بالإضافة إلى كل شيء آخر، يمكن أن تحتوي على كمية هائلة من القمامة الموجودة بجوار النص:


ستحاول هذه الصورة للكلمة "نعم" شرح مدى تعقيد التحليل. سنفترض أن هذه سلسلة كاملة، لكن b13 وi6 عبارة عن أجزاء من القمامة نتيجة للتقريب. يفتقد الحرف "y" نقطة، ولا يوجد أي من الأحرف الموجودة في قاعدة المعرفة لنقول على وجه اليقين أننا نتعامل مع سطر نص من السطر "c" إلى السطر "i". وارتفاع الخط مهم جدًا بالنسبة لنا، لأنه من أجل الإلتصاق نحتاج إلى معرفة مدى قرب الأجزاء التي يجب "لصقها معًا" وتحليلها. بعد كل شيء، قد يكون هناك موقف عندما نبدأ بطريق الخطأ في لصق الأحرف من سلسلتين وستكون نتائج هذا التعرف بعيدة عن المثالية.

الاستدلال في تحليل الصور.


ما هي الاستدلالات في التعرف على الصور؟
هذه هي العملية التي يتم من خلالها التعرف على مجموعة مميزة غير موجودة في قاعدة المعرفة كحرف أبجدي صحيح. لقد فكرت لفترة طويلة في كيفية إجراء التحليل، وفي النهاية تبين أن الخوارزمية الأكثر نجاحًا هي:

  1. أجد جميع المجموعات المميزة في قاعدة المعرفة التي تمتلكها أكبر عددقيم شظايا Fيطابق الصورة المعترف بها.
  2. بعد ذلك، أختار فقط تلك المجموعات المميزة التي، مع الصورة التي يمكن التعرف عليها بناءً على قيم F غير المتساوية للجزء، لا يزيد الفرق عن +- 1 وحدة: -1< F < 1. И это все подсчитывается для каждой буквы алфавита.
  3. ثم أجد الرمز الذي لديه أكبر عددالأحداث. معتبرا ذلك نتيجة لتحليل ارشادي.
لا تعطي هذه الخوارزمية أفضل النتائج على الصور ذات الأحرف الصغيرة (حجم الخط 7 - 12) . ولكن قد يكون ذلك بسبب حقيقة أن قاعدة المعرفة تحتوي على مجموعات مميزة لصور مماثلة لرموز مختلفة.

مثال للاستخدام في C#.

مثال على بداية التعرف على الصور الصورة. سيحتوي المتغير الناتج على النص:

أداة التعرف على var = new TextRecognizer(container); تقرير var = أداة التعرف.Recognize(image); // نص خام. نتيجة فار = تقرير.RawText();// قائمة بجميع الأجزاء وحالة التعرف على كل منها.

شظايا فار = تقرير.Symbols؛

مشروع تجريبي. كتبت لعرض مرئي للعمل WPF طلب. يتم إطلاقه من مشروع اسمه " Qocr.Application.Wpf

". فيما يلي مثال لنافذة بها نتيجة التعرف:

  • للتعرف على الصورة ستحتاج: المطابع"صورة جديدة"
  • يختار صورة للتعرف عليها باستخدام "أبيض وأسود
  • "يمكنك معرفة الصورة التي سيتم تحليلها. إذا رأيت صورة ذات جودة منخفضة للغاية، فلا تتوقع نتائج جيدة. لتحسين النتائج، يمكنك محاولة كتابة صورة ملونة إلى محول أبيض وأسود بنفسك. اختيار اللغة.
  • "لغة" تتعرف النقرات.
"يتعرف على"
يجب وضع علامة على جميع أجزاء الصورة بإطار برتقالي أو أخضر.

مثال للتعرف على النص باللغة الإنجليزية: ومع احتمال 0.1 - للفئة C 2. يمكن حل المشكلة المذكورة باستخدام شركة صغيرة ومتوسطة ذات مدخلات N ومخرجات M، مدربة على إنتاج متجه عند المخرجاتج ، عندما يتم إعطاء الإدخال.

ص أثناء عملية التعلم، تقوم الشبكة ببناء رسم خرائط P → C. ليس من الممكن الحصول على هذا التعيين بالكامل، ولكن من الممكن الحصول على عدد عشوائي من الأزواج (ع → ج) ، عندما يتم إعطاء الإدخال، متصلة عن طريق العرض. لمتجه تعسفي

عند الإدخال يمكننا الحصول على احتمالات تقريبية لعضوية الفصل عند الإخراج.

غالبًا ما يتبين أن مكونات متجه الإخراج يمكن أن تكون أقل من 0 أو أكبر من 1، ويتم استيفاء الشرط الثاني (1) تقريبًا فقط. عدم الدقة هو نتيجة للطبيعة التناظرية للشبكات العصبية. معظم النتائج التي تم الحصول عليها باستخدام الشبكات العصبية غير دقيقة. بالإضافة إلى ذلك، عند تدريب الشبكة، لا يتم إدخال الشروط المحددة المفروضة على الاحتمالات مباشرة في الشبكة، ولكنها متضمنة ضمنيًا في مجموعة البيانات التي يتم تدريب الشبكة عليها. وهذا هو السبب الثاني لعدم صحة النتيجة.

هناك طرق أخرى لإضفاء الطابع الرسمي.

سنقوم بتمثيل الحروف على شكل صور نقطية (الشكل).

أرز. . صورة بقعة. تتوافق خلية البكسل الداكنة في الصورة معأنا إي = تتوافق خلية البكسل الداكنة في الصورة مع 0 . وتتمثل المهمة في تحديد الحرف الذي تم تقديمه من الصورة.

دعونا نبني الشركات الصغيرة والمتوسطة مع ن ط X ن يالمدخلات، حيث يتوافق كل إدخال مع بكسل واحد: س ك = أنا إي .ستكون سطوع البكسل عبارة عن مكونات لمتجه الإدخال.

كإشارات خرج، نختار احتمالات أن الصورة المعروضة تتوافق مع حرف معين:

تقوم الشبكة بحساب الإخراج:

أين هو الخروج ومع احتمال 0.1 - للفئة C 2. يمكن حل المشكلة المذكورة باستخدام شركة صغيرة ومتوسطة ذات مدخلات N ومخرجات M، مدربة على إنتاج متجه عند المخرجات 1 = 0.9 يعني مثلا أنه يتم عرض صورة للحرف "A" والشبكة متأكدة من ذلك بنسبة 90%، الإخراج ومع احتمال 0.1 - للفئة C 2. يمكن حل المشكلة المذكورة باستخدام شركة صغيرة ومتوسطة ذات مدخلات N ومخرجات M، مدربة على إنتاج متجه عند المخرجات 2 = 0.1 - أن الصورة تتوافق مع الحرف "B" مع احتمال 10%، الخ.

هناك طريقة أخرى: يتم تحديد مدخلات الشبكة بنفس الطريقة، ويكون الإخراج رقمًا واحدًا فقط مالرسالة المقدمة. تتعلم الشبكة إعطاء المعنى محسب الصورة المعروضة أنا:



(أنا آي جي) → م

في هذه الحالة، العيب هو أن الحروف ذات الأرقام المتشابهة m، ولكن الصور المختلفة، قد تخلط بين الشبكة أثناء التعرف.

تمرين التعرف على الحروف. مستويات صعوبة مختلفة. يتم تطبيق قناع مع الضوضاء على الرسالة. في بعض الأحيان تحتاج إلى أن تكون سريع البديهة لكي تفهم عن طريق الحذف نوع الرسالة الموجودة في المهمة.

تعليم الأطفال القراءة والحروف الأبجدية الروسية. ما هو الحرف الذي يظهر؟ اختر الإجابة الصحيحة على اليمين.

أي حرف مخفي؟ لعبة على الانترنتل التطور المبكرأطفال. التعرف على حروف الأبجدية الروسية

كيفية تعلم حروف الأبجدية الروسية

غالبًا ما يبدأ تدريس حروف الأبجدية الروسية بالترتيب كما هي مكتوبة في الكتاب التمهيدي. في الواقع، ينبغي تعليم الحروف حسب تكرار استخدامها. سأعطيك تلميحًا بسيطًا - يتم استخدام الحروف الموجودة في وسط لوحة المفاتيح أكثر من تلك الموجودة على الأطراف. لذلك، عليك أولاً أن تحفظ A، P، R، O.... وتترك كلمات مثل Y، X، F، Shch لتناول وجبة خفيفة...

ما هو الأفضل - تعليم الطفل قراءة الحروف أو المقاطع؟

يقوم العديد من المعلمين بالتدريس على الفور في المقاطع. أقترح عليك التغلب على هذه المشكلة الصغيرة ولعب الألعاب عبر الإنترنت بدلاً من تعلم المقاطع. هكذا يتعلم الطفل ويلعب في نفس الوقت. أو بالأحرى يبدو له أنه يلعب وفي نفس الوقت يكرر الأصوات الضرورية بشكل لا إرادي.

تتمثل ميزة الألعاب عبر الإنترنت في أنه إذا نطقت حرفًا بشكل غير صحيح، فسوف يقوم جهاز المحاكاة بتكرار الإجابة الصحيحة بصبر حتى تتذكر.

هل تساعدك كتب ABC على تعلم الحروف؟ لماذا لا تزال تستخدم الاشعال الورقية في ممارسة التدريس

تقليديا، يتم استخدام الكتب الورقية ABC لتعليم الحروف. مزاياها لا يمكن إنكارها. إذا قمت بإسقاط النسخة الورقية على الأرض، فلا داعي للقلق بشأن كسر الجهاز. يمكن فتح البادئات على صفحة معينة ووضعها في مكان ظاهر. كل هذا غير موجود في الأجهزة الإلكترونية.

ومع ذلك، تتمتع أجهزة محاكاة التدريب على القراءة القابلة للبرمجة أيضًا بمزايا معينة، على سبيل المثال، يمكنها التحدث، على عكس نظيراتها الورقية. لذلك، يمكننا أن نوصي بالمصادر الورقية والإلكترونية.

هل تساعدك التمارين عبر الإنترنت على تذكر الحروف؟

التركيز الرئيسي عند استخدام الألعاب الإلكترونية وعبر الإنترنت هو أن الشخص يكرر نفس المعلومات بشكل لا إرادي عدة مرات. كلما حدث التكرار في كثير من الأحيان، كلما تم إدخال المعلومات بشكل أكثر حزما في الوعي والدماغ. لهذا السبب تمارين على الانترنتإضافة مفيدة جدًا للمكعبات التقليدية والكتب الورقية.

في أي عمر يجب إرسال الطفل إلى المراكز التعليمية؟

سرعة النضج مختلفة. عادة. الفتيات حتى سن معينة يتقدمن على الأولاد في التنمية. تبدأ الفتيات في التحدث في وقت مبكر، فهن أكثر توجهاً اجتماعيًا وأكثر قابلية للتعلم. على العكس من ذلك، فإن الأولاد غالبًا ما يكونون مصابين بالتوحد الشديد - ويمشون بمفردهم. من هذا يمكننا أن نستنتج أن الفتيات يتعلمن القراءة في وقت أبكر قليلاً من الأولاد. لكن هذا مجرد رسم تخطيطي خارجي. كل طفل هو فرد ويمكن اختبار استعداده للتعلم في الممارسة العملية. هل يستمتع طفلك بحضور الدروس؟ فهل يبقى في ذهنه شيء بعد أن نسيه؟

ربما تحاولين الدراسة بمفردك، خاصة أن ركوب الحافلة يستغرق وقتاً طويلاً، ولا أحد يفهم طفلك أفضل من الأم والأب.

ماذا تفعل إذا كان طفلك لا يتذكر الحروف

الدراسة صعبة. ولا يعتمد الأمر على ما إذا كان شخصًا بالغًا أم طفلاً. إنه أمر صعب للغاية للتعلم. وبالإضافة إلى ذلك، يتعلم الأطفال فقط من خلال اللعب. والحقيقة الأخرى هي أنه لكي تتعلم شيئًا ما، يجب أن تمارسه أو تكرره عدة مرات. لذلك، ليس من المستغرب أن يتذكر الأطفال الحروف بشكل سيء للغاية.

هناك مجموعة منفصلة من الأطفال الذين يبدأون في التحدث متأخرًا وفي نفس الوقت لا يخلطون بين الحروف فحسب، بل الأصوات أيضًا. مع هؤلاء الأشخاص، تحتاج إلى رسم الحروف معًا، واستخدام جميع المواد الممكنة لهذا الغرض، والحبوب، والمباريات، والحصى، وأقلام الرصاص - كل ما هو في متناول اليد. ارسمها واطلب من طفلك أن يكررها.

يمكن القيام به الإملاءات الرسوميةيمكنك لعب السحب والتكرار.

ماذا تفعل إذا كان طفلك يخلط بين الحروف، على سبيل المثال، D و T

إذا كان الطفل يخلط بين الحروف، فهذا يعني أنه من السابق لأوانه الانتقال إلى قراءة الكلمات. ارجع وكرر الحروف. غالبًا ما يخلط الأطفال بين الحروف الصوتية وغير الصوتية أو التهجئة المشابهة، على سبيل المثال، P وR. يمكن أن تساعد ممارسة التكرار. على سبيل المثال، يمكنك نحت الحروف معًا، يمكنك صنع حروف من الجسم، على سبيل المثال، بوضع ذراعيك على الجانبين لتصوير حرف T.

كيفية تعليم الطفل حفظ الحروف إذا كان لا يريد ذلك

التكرار هو أم التعلم. كرر الحروف بالكلمات، كرر الحروف بالمقاطع، حاول تخمين الحروف. دع الطفل يكتب الرسالة وحاول التخمين. أو يمكنك أن تفعل العكس - حاول تشكيل حرف من حبات الأرز، وسيقوم ابنك أو ابنتك بتخمين نوع الحرف. يمكنك الكتابة على الرمال بالعصا.

لماذا لا يستطيع نطق الحروف بشكل صحيح؟ كيف تعلم الطفل نطق الحروف بوضوح ووضوح؟

قد تكون الفجوات على المستوى الفسيولوجي. لا يسمع الشخص نفسه بشكل صحيح. أو يبدو له أنه يتكلم بشكل صحيح. من السهل جدًا التحقق من ذلك - ما عليك سوى تسجيل المحادثة على مسجل الصوت والاستماع إلى قراءة الطفل.

يمكن أن يكون أيضًا نقصًا بسيطًا في التدريب. يحتاج الأشخاص المختلفون إلى عدد مختلف من المرات لتكرار المعلومات قبل أن يتم تذكرها، والأطفال ليسوا استثناءً. ويجب تكرارها عدة مرات وفي مواقف مختلفة قبل أن يبدأ في نطق الحروف والأصوات بشكل صحيح.

ما يجب ملاحظته أيضًا هو أنك بحاجة إلى حب الأطفال والعمل معهم بشكل دوري. لا تبدأ العمليات.

كيفية تعليم طفلك الحروف الأبجدية للتحضير للمدرسة

أنت بحاجة للعمل مع الأطفال في شكل اللعبة. تماما كما هو مذكور في هذا الموقع. سر آخر للتدريب هو أنك تحتاج إلى الدراسة في أجزاء صغيرة. لا يستطيع الأطفال الحفاظ على انتباههم لأكثر من 5 دقائق. لذلك، من غير المجدي ببساطة الدراسة لفترة أطول.

ما هي الحروف التي يجب أن تبدأ بحفظ الحروف الأبجدية بها؟

عليك أن تبدأ في حفظ الحروف ذات الحروف شائعة الاستخدام. السر الثاني هو أن تتذكر الحروف التي يتكون منها اسم الطفل، اسم الأم والأب، ويمكنك إضافة إلى هذه الكلمات أسماء الأخ والأخت والأجداد. هذه هي الأسماء المفضلة لدي.

بالمناسبة، إذا كنت تتعلم الكتابة باللمس، فإن الكلمة الأولى التي تحتاجها لبدء التدريب على الكتابة هي اسمك الأول والأخير مرة أخرى.

هل يحتاج طفلك إلى حفظ حروف الأبجدية الإنجليزية؟

معرفة الأبجدية الإنجليزيةلن يضر. في المدرسة، لا يدرسون الحروف الأبجدية، ولكنهم يبدأون القراءة على الفور، ويتركون الأبجدية للوالدين. ومن الجدير بالذكر أيضًا أن الكبيرة والصغيرة الحروف الانجليزيةتبدو مختلفة ويجب أن نتذكرها. إذا بدأ طفلك في التحدث متأخرًا، فمن المرجح أن تذكر الحروف اللاتينية سيكون مشكلة بالنسبة له.

هل من الممكن تعليم الطفل القراءة فوراً بالكلمات؟

تبدو اللغة الروسية المكتوبة مثل اللغة الروسية المنطوقة، على عكس الإنجليزية أو الفرنسية، لذا تذكر الكلمات

كيفية تذكر الأرقام لمرحلة ما قبل المدرسة

ارسم أرقامًا، وعد العصي، وعندما تمشي، قم بعد السيارات الحمراء والبيضاء، واحسب ما إذا كان هناك المزيد من الرجال أو النساء الذين يسيرون في الشارع. تحويل كل شيء إلى ألعاب.

حاول قراءة الرسالة النصية بنفسك - لن يستغرق الأمر وقتًا طويلاً فحسب، بل سيكون أيضًا مختلفًا عن الطريقة التي نتحدث بها فعليًا. الكبار لا يتهجؤون - إلا إذا كانت الكلمة غير مألوفة أو بلغة أجنبية. ومن ثم، لكي يسمعوها، يقومون بقراءتها ببطء ونطق الكلمات بعناية.

لماذا ينسى طفل ما قبل المدرسة الحروف؟ تعليم القراءة من خلال الألعاب

لماذا ينسى الطفل الحروف رغم أنه تعلمها بالأمس؟

عادة، يتذكر الطفل بسهولة بعض الحروف، ولكن ليس الكثير من الحروف الأخرى. يتمثل دور الشخص البالغ في ملاحظة ما لا ينجح فيه جناحه وإعطاء مهام إضافية.

شيء آخر مهم هو الانتظام. نظرًا لأن كل التعلم بالنسبة للطفل هو بصراحة حشو وتكرار، فيجب أن تكون عملية التعلم بحيث يتم تكرار المعلومات على فترات زمنية معينة.

درس إبنجهاوس (اقرأ المزيد عن هذا على ويكيبيديا) مدى سرعة نسيان المعلومات التي لا معنى لها بالنسبة لشخص ما وتوصل إلى استنتاج مفاده أن 40٪ من المعلومات تُنسى في أول عشرين دقيقة. وإذا كان من المستحيل أن نقول بالضبط ما يعنيه حرف معين، فهذا يعادل حقيقة أن الرسالة غير مألوفة تماما. يجب أن يكون هناك اعتراف لا لبس فيه بنسبة 100٪.

كرر، كرر، كرر

على سبيل المثال، يمكنك تدريب المستودعات (مقطع لفظي، مجموعة من الحروف) علىوتعلم الطفل بشكل أو بآخر التعرف على المجموعة وقراءتها. أضف المقطع "لكن" إلى المهام، واطلب منهم قراءة الكلمات، مما يساعدهم على قراءة الحروف التي لا تزال غير مألوفة للطفل. ومع ذلك، يمكن للطفل النقر على المقاطع بنفسه والاستماع إلى قراءة الكمبيوتر.

مطلوب إنشاء شبكة عصبية للتعرف على 26 حرفًا من الأبجدية اللاتينية. سنفترض أن هناك نظاماً لقراءة الحروف، وهو يمثل كل حرف على شكل مصفوفة. على سبيل المثال، يمكن تمثيل الحرف A كما هو موضح في الشكل. 2.22.

أرز. 2.22. تمثيل الرمز

النظام الفعلي لقراءة الشخصيات لا يعمل بشكل مثالي، والشخصيات نفسها تختلف في الأسلوب. لذلك، على سبيل المثال، بالنسبة للرمز A، قد لا تكون الوحدات موجودة في نفس الخلايا كما هو موضح في الشكل. 2.22. بالإضافة إلى ذلك، قد تظهر القيم غير الصفرية خارج مخطط الأحرف. قد تحتوي الخلايا المقابلة للمخطط التفصيلي للرمز على قيم مختلفة عن 1. وسنسمي جميع التشوهات بالضوضاء.

MATLAB لديه وظيفة prprob، والتي تُرجع مصفوفة، يمثل كل عمود منها مصفوفة مكتوبة كمتجه يصف الحرف المقابل (يصف العمود الأول الحرف A، والثاني يصف الحرف B، وما إلى ذلك). وظيفة prprobتقوم أيضًا بإرجاع مصفوفة مستهدفة بالحجم، يحتوي كل عمود منها على 1 واحد في صف واحد يتوافق مع رقم الحرف مع كون العناصر المتبقية من العمود صفرًا. على سبيل المثال، يحتوي العمود الأول المقابل للحرف A على الرقم 1 في الصف الأول.

مثال. دعونا نحدد قالبًا للحرف A (program Template_A.m).

% مثال على تشكيل قالب لحرف A

بروب.

أنا = 1؛ % رقم الحرف أ

v=alphabet(:,i); ناقلات٪ المقابلة للحرف A

template=reshape(v, 5,7)";

بالإضافة إلى الوظيفة الموصوفة بالفعل prprobيستخدم البرنامج وظائف إعادة تشكيل، الذي يشكل المصفوفة، وبعد النقل - (تأكد من أنه ليس من الممكن تشكيل المصفوفة على الفور)، والدالة com.plotchar، والذي يرسم 35 عنصرًا متجهًا بنمط شبكي. بعد تنفيذ البرنامج Template_A.mنحصل على مصفوفة نموذجوالقالب بالحرف A كما هو موضح في الشكل. 2.23.

أرز. 2.23. قالب حرف A

للتعرف على حروف الأبجدية اللاتينية، من الضروري بناء شبكة عصبية تحتوي على 35 مدخلاً و26 خلية عصبية في طبقة الإخراج. لنفترض أن عدد الخلايا العصبية في الطبقة المخفية هو 10 (تم اختيار هذا العدد من الخلايا العصبية تجريبياً). إذا ظهرت صعوبات أثناء التعلم، فمن الممكن زيادة عدد الخلايا العصبية في هذا المستوى.



تم إنشاء شبكة التعرف على الأنماط بواسطة الوظيفة com.patternnet.يرجى ملاحظة أنه عند إنشاء شبكة، لا يتم تحديد عدد الخلايا العصبية في طبقات الإدخال والإخراج. يتم تعيين هذه المعلمات ضمنيًا عند تدريب الشبكة.

فكر في برنامج للتعرف على حروف الأبجدية اللاتينية Char_recognition.m

% برنامج التعرف على الحروف الأبجدية اللاتينية

بروب. ٪ تشكيل المدخلات والمتجهات المستهدفة

الحجم (الأبجدية)؛

الحجم (الأهداف)؛

% الشبكات

قطار (صافي، P، T)؛

% التعلم في وجود الضوضاء

ف = ;

قطار(netn,P,T);

قطار(netn,P,T);

% اختبار الشبكة

الضوضاء_الغضب=0:0.05:0.5; ٪ مجموعة من مستويات الضوضاء (الانحرافات المعيارية للضوضاء

لمستوى الضوضاء=noise_rage

لأني=1:max_test

اختبار % للشبكة 1

اختبار % للشبكة 2

العنوان("خطأ في الشبكة");

xlabel("مستوى الضوضاء");

ylabel("نسبة الخطأ");

المشغل = prprob; تشكيل مجموعة من ناقلات الإدخال الأبجديةالحجم مع أنماط الأحرف الأبجدية ومجموعة من المتجهات المستهدفة الأهداف.

يتم إنشاء الشبكة من قبل المشغل net=patternnet.دعونا نقبل إعدادات الشبكة الافتراضية. يتم تدريب الشبكة أولاً في غياب الضوضاء. يتم بعد ذلك تدريب الشبكة على 10 مجموعات من المتجهات المثالية والمزعجة. يتم استخدام مجموعتين من المتجهات المثالية لضمان احتفاظ الشبكة بالقدرة على تصنيف المتجهات المثالية (بدون ضوضاء). وبعد التدريب، "نسيت" الشبكة كيفية تصنيف بعض المتجهات الخالية من الضوضاء. ولذلك، ينبغي تدريب الشبكة مرة أخرى على المتجهات المثالية.

جزء البرنامج التالي يتدرب في غياب الضوضاء :

% التدريب على الشبكة في غياب الضوضاء

قطار (صافي، P، T)؛

disp("اكتمل تدريب الشبكة في حالة عدم وجود ضوضاء. اضغط على Enter");

يتم التدريب في ظل وجود ضوضاء باستخدام نسختين مثاليتين ونسختين صاخبتين من متجهات الإدخال. تمت محاكاة الضوضاء بواسطة أرقام شبه عشوائية موزعة بشكل طبيعي بمتوسط ​​صفر وانحراف معياري قدره 0.1 و0.2. التدريب في وجود الضوضاء ينتج جزء البرنامج التالي:

% التعلم في وجود الضوضاء

netn = net; نسبة التوفير في الشبكة المدربة

ت = ;

ف = ;

قطار(netn,P,T);

disp("اكتمل تدريب الشبكة في حالة وجود ضوضاء. اضغط على Enter");

وبما أن الشبكة تم تدريبها في ظل وجود ضوضاء، فمن المنطقي تكرار التدريب دون ضوضاء لضمان التصنيف الصحيح للمتجهات المثالية:

إعادة التدريب في غياب الضوضاء

قطار(netn,P,T);

disp("اكتملت إعادة تدريب الشبكة في حالة عدم وجود ضوضاء. اضغط على Enter");

تم إجراء اختبار الشبكة لهيكلين للشبكة: الشبكة 1، المدربة على المتجهات المثالية، والشبكة 2، المدربة على التسلسلات الصاخبة. تمت إضافة ضوضاء بمتوسط ​​0 وانحراف معياري من 0 إلى 0.5 في خطوات 0.05 إلى متجهات الإدخال. لكل مستوى ضوضاء، تم إنشاء 10 ناقلات صاخبة لكل رمز، وتم حساب مخرجات الشبكة (من المرغوب فيه زيادة عدد المتجهات الصاخبة، ولكن هذا سيزيد بشكل كبير من وقت تشغيل البرنامج). يتم تدريب الشبكة على تكوين واحد في العنصر الوحيد لمتجه الإخراج، الذي يتوافق موضعه مع رقم الحرف الذي تم التعرف عليه، وملء بقية المتجه بالأصفار. لن يقوم خرج الشبكة أبدًا بإنشاء متجه إخراج يتكون من 1 و0 بالضبط. لذلك، في ظل ظروف الضوضاء، تتم معالجة متجه الإخراج بواسطة الدالة تنافس، الذي يحول متجه الخرج بحيث تستقبل أكبر إشارة خرج القيمة 1 وتستقبل جميع إشارات الخرج الأخرى القيمة 0.

يبدو جزء البرنامج المقابل كما يلي:

% قم بإجراء اختبار لكل مستوى من مستويات الضوضاء

لمستوى الضوضاء=noise_rage

لأني=1:max_test

P=alphabet+randn(35, 26)*مستوى الضوضاء;

اختبار % للشبكة 1

Errors1=errors1+sum(sum(abs(AA-T)))/2;

اختبار % للشبكة 2

Errors2=errors2+sum(sum(abs(AAn-T)))/2;

٪ متوسط ​​​​قيم الخطأ (تسلسلات max_test لـ 26 متجهًا مستهدفًا)

الشبكة1=;

الشبكة2=;

مؤامرة(noise_rage,network1*100,noise_rage,network2*100);

العنوان("خطأ في الشبكة");

xlabel("مستوى الضوضاء");

ylabel("نسبة الخطأ");

legend("ناقلات الإدخال المثالية"،"ناقلات الإدخال الصاخبة");

disp("اكتمل الاختبار");

عند حساب خطأ التعرف، على سبيل المثال، Errors1=errors1+sum(sum(abs(AA-T)))/2، يؤخذ في الاعتبار أنه في حالة التعرف غير الصحيح على عنصرين من متجه الإخراج ومتجه الهدف لا تتطابق، لذلك عند حساب الخطأ، يتم إجراء القسمة على 2 . Sum(abs(AA-T)) يحسب عدد العناصر غير المتطابقة لمثال واحد. يقوم المجموع sum(sum(abs(AA-T))) بحساب عدد العناصر غير المتطابقة في جميع الأمثلة.

يظهر الشكل 1 الرسوم البيانية لخطأ التعرف لشبكة مدربة على ناقلات الإدخال المثالية وشبكة مدربة على ناقلات صاخبة. 2.24. من الشكل. يوضح الشكل 2.24 أن الشبكة المدربة على الصور المزعجة تعطي خطأً بسيطًا، لكن لا يمكن تدريب الشبكة على متجهات الإدخال المثالية.

أرز. 2.24. أخطاء الشبكة حسب مستوى الضوضاء

دعونا نتحقق من تشغيل الشبكة المدربة (يجب أن تكون الشبكة المدربة موجودة في مساحة عمل MATLAB). برنامج الاعتراف_J.mيقوم بإنشاء متجه صاخب للحرف J ويتعرف على الحرف. وظيفة راندنينشئ رقمًا عشوائيًا زائفًا يتم توزيعه وفقًا للقانون العادي مع توقع رياضي صفر وانحراف معياري للوحدة. رقم عشوائي مع التوقع الرياضي موالانحراف المعياري دتم الحصول عليها بواسطة الصيغة م+راندن*د(في البرنامج م = 0، د = 0.2).

noisyJ = Alphabet(:,10)+randn(35,1) * 0.2;

plotchar(noisyJ);

disp("حرف صاخب. اضغط على Enter");

A2 = netn(noisyJ);

A2 = تنافس(A2);

ns = find(A2 == 1);

disp("تم التعرف على الرمز");

بلوتشار(alphabet(:,ns));

يعرض البرنامج رقم الحرف الذي تم التعرف عليه ونمط الحرف المزعج (شكل 2.25) ونمط الحرف الذي تم التعرف عليه (2.26).

أرز. 2.25. قالب رسالة صاخبة

أرز. 2.26. نمط الحروف المعترف به

وهكذا توضح البرامج المدروسة مبادئ التعرف على الصور باستخدام الشبكات العصبية. أتاح تدريب الشبكة على مجموعات البيانات المزعجة المختلفة إمكانية تدريب الشبكة على العمل مع الصور المشوهة بسبب الضوضاء.

أسئلة

1. قم بتنفيذ جميع الأمثلة المذكورة.

2. خبرة في التعرف على الحروف المختلفة

3. التحقق من تأثير الضوضاء في البرامج على دقة التعرف على الحروف.

تقريب الوظيفة

مقالات ذات صلة