حسابي

بحث

القائمة

مرحبًا،

لدي نظام مبني على Whisper API لتحويل الصوت إلى نص، لكن نسبة الخطأ تصل إلى 30%، مع التسجيلات باللهجة السعودية لذلك فأنا ارغب في حلول بديلة اخرى .

المطلوب: أبحث عن خبير يوفر لي أحد الحلين التاليين:

إما مكتبة جاهزة ومدربة مسبقًا (Pretrained model)، قابلة للتشغيل مباشرة على Google Colab أو بيئة بايثون Python ، مع دعم ممتاز للهجة السعودية، وتقديم شرح لتثبيتها وتشغيلها.

أو مزود خدمة API مدفوع، يقدم دقة عالية (بنسبة خطأ لا تزيد عن 10-5%) في تحويل الصوت إلى نص، مع تجربة فعلية على عينة سأرسلها.

هام جدًا:

لا أطلب تدريب نموذج من الصفر .

لا أبحث عن أفكار نظرية أو مقترحات بدون تجربة فعلية.

أبحث فقط عن شخص يُقدّم حل جاهز ودقيق وقابل للاستخدام مباشرة.

معايير النجاح:

دقة بنسبة خطأ لا تزيد عن 10-5% عند تجربة النموذج على ((العينة المرفقة)) .

تقديم شرح مبسط لطريقة التشغيل (سواء كانت API أو سكربت بايثون).

إذا كانت لديك مكتبة أو أداة قوية لمعالجة الصوت وتحويله إلى نص بدقة عالية بنسبة خطأ لا تتجاوز 10%، بإمكانك تجربة العينة المرفقة التالية قبل التقديم على المشروع :

ملف صوتي قصير (2دقائق)
ملف نصي يحتوي على النص الصحيح الكامل

https://drive.google.com/file/d/1O0f4d2diZZMvBsDiwOCoydhTByEqPedp/view?usp=sharing

يمكنك مقارنة نتيجة الأداة التي تستخدمها مع النص الصحيح المرفق ويوجد شرح في الملف عن كيفية المقارنة ورابط موقع المقارنة

وشكراً جزيلاً...
عن الموضوع

التعليقات (1)

منذ 8 أيام و16 ساعة
السلام عليكم ورحمة الله وبركاته
معك م/عبدالله اسامه مهندس علوم البيانات والذكاء الاصطناعي , يمكننى تقديم حل لك عن طريق pre trained model مجرب على اللهجه السعوديه وقدم accuracy ممتازه تصل الي 93 % ولست بحاجه الى اشتراك فيه , ولكن احب التنويه على جودة ملف الصوت
قد قمت بالاطلاع على الملف الصوتى فى اللينك و لاحظت ان به بعض الكلمات به تداخل اصوات اة غير واضحه وهذه تمثل تحدى كبير لاى موديل وقمت بتجربة الموديل على الملف وقام باداء ممتاز (باستثناء تلك الكلمات)
منتظر التواصل معك لمزيد من التفاصيل
عن الموضوع