مكتبة برمجية لتحويل صوت إلى نص Python

مرحبًا،

لدي نظام مبني على Whisper API لتحويل الصوت إلى نص، لكن نسبة الخطأ تصل إلى 30%، مع التسجيلات باللهجة السعودية لذلك فأنا ارغب في حلول بديلة اخرى .

المطلوب: أبحث عن خبير يوفر لي أحد الحلين التاليين:

إما مكتبة جاهزة ومدربة مسبقًا (Pretrained model)، قابلة للتشغيل مباشرة على Google Colab أو بيئة بايثون Python ، مع دعم ممتاز للهجة السعودية، وتقديم شرح لتثبيتها وتشغيلها.

أو مزود خدمة API مدفوع، يقدم دقة عالية (بنسبة خطأ لا تزيد عن 10-5%) في تحويل الصوت إلى نص، مع تجربة فعلية على عينة سأرسلها.

هام جدًا:

لا أطلب تدريب نموذج من الصفر .

لا أبحث عن أفكار نظرية أو مقترحات بدون تجربة فعلية.

أبحث فقط عن شخص يُقدّم حل جاهز ودقيق وقابل للاستخدام مباشرة.

معايير النجاح:

دقة بنسبة خطأ لا تزيد عن 10-5% عند تجربة النموذج على ((العينة المرفقة)) .

تقديم شرح مبسط لطريقة التشغيل (سواء كانت API أو سكربت بايثون).

إذا كانت لديك مكتبة أو أداة قوية لمعالجة الصوت وتحويله إلى نص بدقة عالية بنسبة خطأ لا تتجاوز 10%، بإمكانك تجربة العينة المرفقة التالية قبل التقديم على المشروع :

ملف صوتي قصير (2دقائق)
ملف نصي يحتوي على النص الصحيح الكامل

https://drive.google.com/file/d/1O0f4d2diZZMvBsDiwOCoydhTByEqPedp/view?usp=sharing

يمكنك مقارنة نتيجة الأداة التي تستخدمها مع النص الصحيح المرفق ويوجد شرح في الملف عن كيفية المقارنة ورابط موقع المقارنة

وشكراً جزيلاً...

عن الموضوع

ناشر الموضوع

.Abdulrahman H

مطور أعمال

التعليقات (1)

.Abdallah O

منذ سنة وشهر

السلام عليكم ورحمة الله وبركاته
معك م/عبدالله اسامه مهندس علوم البيانات والذكاء الاصطناعي , يمكننى تقديم حل لك عن طريق pre trained model مجرب على اللهجه السعوديه وقدم accuracy ممتازه تصل الي 93 % ولست بحاجه الى اشتراك فيه , ولكن احب التنويه على جودة ملف الصوت
قد قمت بالاطلاع على الملف الصوتى فى اللينك و لاحظت ان به بعض الكلمات به تداخل اصوات اة غير واضحه وهذه تمثل تحدى كبير لاى موديل وقمت بتجربة الموديل على الملف وقام باداء ممتاز (باستثناء تلك الكلمات)
منتظر التواصل معك لمزيد من التفاصيل

مكتبة برمجية لتحويل صوت إلى نص Python

عن الموضوع

.Abdulrahman H

التعليقات (1)

.Abdallah O

منذ سنة وشهر

عن الموضوع

.Abdulrahman H

آخر المساهمات

قمت بتنفيذ مشروع Asp MVCتسهيل ربط المرضى بالأ ...

مصمم مينوهات مطاعم باكثر من شكل وتصميم

أحتاج الى مبرمج full stack mern developer

استنساخ الصوت بالذكاء الاصطناعي

محتاج مبرمج أو شخص عنده خبرة في الاستضافات

ادارة صفحات وسائل التواصل الاجتماعي

مطلوب مصمم شعار وهوية بصرية لمشروع جديد

من أعمالي تصميم لوجو بريق - bariq

تعديل قسم الموضوع

مكتبة برمجية لتحويل صوت إلى نص Python

عن الموضوع

التعليقات (1)

.Abdallah O منذ سنة وشهر

عن الموضوع

آخر المساهمات

تعديل قسم الموضوع

.Abdallah O

منذ سنة وشهر