مطلوب مطور بايثون / ذكاء اصطناعي لبناء أداة تدقيق

السلام عليكم ورحمة الله وبركاته،

نبحث عن مطور محترف أو خبير في مجالات الذكاء الاصطناعي، معالجة اللغات الطبيعية (NLP)، وتقنيات الـ OCR، لتطوير أداة برمجية (تطبيق محلي Desktop Application) مخصصة لتدقيق جودة البيانات ومطابقتها تلقائياً بين ملفات Excel والملفات الإعلانية (PDF والصور)، بهدف إلغاء الأخطاء البشرية تماماً.

وصف الفكرة وآلية العمل المطلوبة:

قراءة المصدر الرئيسي: يقوم النظام بقراءة ملف إكسل (أو Google Sheets) يحتوي على جدول بيانات تفصيلية (نصوص وأرقام).

قراءة الملف المراد فحصُه: يتم رفع ملف برشور إعلاني أو تقرير تسويقي (بصيغة PDF أو صور عالية الجودة).

المطابقة والتدقيق: يقوم البرنامج باستخراج النصوص والأرقام من البرشور/الـ PDF ومطابقتها آلياً وميكانيكياً مع البيانات المقابلة لها في ملف الإكسل الرئيسي.

التقرير النهائي: يستخرج البرنامج تقريراً فورياً يوضح الخانات المتطابقة بنجاح، ويطلق تنبيهاً باللون الأحمر في حال وجود أي اختلاف أو نقص في الأرقام أو الكلمات، مع تحديد مكان الخطأ بدقة.

ملاحظات وشروط أساسية للمشروع:

سرية وأمن البيانات (شرط أساسي): نظرًا لحساسية البيانات، يشترط أن يعمل البرنامج محلياً بالكامل (Local) على الأجهزة دون الحاجة لرفع البيانات على خوادم سحابية خارجية (أو استخدام نماذج سحابية مفتوحة)، مع الالتزام بتوقيع اتفاقية سرية بيانات (NDA) قبل البدء.

الملكية الفكرية: الكود المصدري (Source Code) والبرنامج سيكونان ملكاً حصرياً لنا فور تسليم المشروع.

فضلاً، عند تقديم عرضك أرجو إفادتي بـ:

التقنيات والمكتبات المقترحة للتنفيذ (مثل Python, Tesseract OCR, OpenCV, PyQt... إلخ).

المدى الزمني المتوقع للتنفيذ والتسليم.

التكلفة التقديرية للمشروع.

نماذج من أعمال سابقة مشابهة إن وجدت.

أتطلع لقراءة عروضكم المهنية ونقاش التفاصيل. بالتوفيق للجميع.

عن الموضوع

التعليقات (16)

منذ ساعتين و57 دقيقة
تواصل معي انا خالد مهندس ذكاء اصطناعي
منذ ساعتين و56 دقيقة
تواصل معي انا مهندس ذكاء اصطناعي واقدر انفذ المطلوب بدقة
منذ ساعتين و55 دقيقة
السلام عليكم ورحمة الله وبركاته، أ تركي كيف حالك!

اطلعت على تفاصيل المشروع، والفكرة قابلة للتنفيذ محلياً بالكامل دون الحاجة إلى رفع أي بيانات إلى خدمات سحابية، مع مراعاة متطلبات السرية وملكية الكود المصدري.

آلية التنفيذ المقترحة:

• قراءة ملفات Excel وGoogle Sheets واستخراج البيانات المطلوبة.
• معالجة ملفات PDF والصور واستخراج النصوص والأرقام باستخدام OCR.
• استخدام تقنيات معالجة الصور لتحسين دقة القراءة قبل الاستخراج.
• بناء محرك مطابقة ذكي للتحقق من توافق النصوص والأرقام بين المصدر الرئيسي والملف الإعلاني.
• إنشاء تقرير تفصيلي يوضح العناصر المتطابقة والأخطاء المكتشفة مع تحديد موقعها وإبرازها بصرياً.
• تشغيل النظام بالكامل محلياً على جهاز العميل دون إرسال البيانات إلى أي خوادم خارجية.

التقنيات المقترحة:
Python، OpenCV، Tesseract OCR أو PaddleOCR، Pandas، PyMuPDF، RapidFuzz، PyQt6 لبناء واجهة سطح المكتب.

في المشاريع المشابهة غالباً أفضّل PaddleOCR بسبب دقته العالية مع المستندات العربية والإنجليزية مقارنة بالحلول التقليدية.

المدة المتوقعة للتنفيذ:
من 3 إلى 5 أسابيع حسب حجم حالات المطابقة المطلوبة وطبيعة النماذج الإعلانية المستخدمة.

التكلفة التقديرية:
بعد مراجعة عينات حقيقية من ملفات Excel والبرشورات المستهدفة يمكن تحديد تكلفة دقيقة، لكن مبدئياً يقع المشروع ضمن فئة المشاريع المتوسطة إلى الكبيرة نظراً لاعتماده على OCR والتدقيق الآلي وإعداد التقارير.

يسعدني الاطلاع على نماذج فعلية من الملفات المستخدمة لمناقشة أفضل آلية للتنفيذ وتقدير الجهد بدقة قبل البدء.

تحياتي.
منذ ساعتين و55 دقيقة
السلام عليكم ورحمة الله وبركاته
اطلعت على تفاصيل المشروع، وأرى أن الفكرة قابلة للتنفيذ بكفاءة عالية من خلال بناء تطبيق Desktop محلي بالكامل (Offline) يضمن سرية البيانات وعدم إرسال أي معلومات إلى خوادم خارجية.
فهمي للمشروع
سيقوم النظام بـ
قراءة البيانات المرجعية من ملفات Excel أو Google Sheets.
استخراج النصوص والأرقام من ملفات PDF والصور باستخدام OCR متقدم.
مطابقة البيانات المستخرجة مع البيانات الأصلية في ملف الإكسل.
اكتشاف أي اختلافات أو أخطاء أو بيانات مفقودة تلقائياً.
إصدار تقرير تفصيلي يوضح:
العناصر المتطابقة.
العناصر المختلفة.
نسبة التطابق.
تحديد موقع الخطأ داخل الملف المرئي.
تمييز الأخطاء بالألوان والتنبيهات.
التقنيات المقترحة
Python
OpenCV لمعالجة الصور وتحسين جودة القراءة
Tesseract OCR أو PaddleOCR (بدقة أعلى للغة العربية)
NLP لمعالجة النصوص والمطابقة الذكية
Pandas لمعالجة ملفات Excel
PyQt6 لتطوير واجهة سطح مكتب احترافية
SQLite لحفظ الإعدادات والسجلات محلياً
إنشاء ملفات تقارير PDF وExcel تلقائياً
المميزات الإضافية المقترحة
دعم اللغة العربية والإنجليزية.
التحقق من الأرقام والأسعار والنسب المئوية بدقة.
مطابقة ذكية للنصوص مع تحمل الاختلافات البسيطة في التنسيق.
سجل كامل لجميع عمليات التدقيق السابقة.
إمكانية إضافة قواعد تحقق مخصصة مستقبلاً.
الأمان والسرية
التطبيق يعمل محلياً بالكامل دون أي اتصال سحابي.
إمكانية توقيع اتفاقية NDA قبل البدء.
تسليم الكود المصدري كاملاً مع جميع الملفات التنفيذية.
نقل الملكية الفكرية بالكامل للعميل عند التسليم.
المدة الزمنية المتوقعة
من 3 إلى 5 أسابيع حسب:
عدد أنواع الملفات المطلوب دعمها.
مستوى تعقيد المطابقة.
حجم التقارير المطلوبة.
التكلفة التقديرية
تبدأ من 800 إلى 2000 دولار تقريباً، ويتم تحديد التكلفة النهائية بعد الاطلاع على عينات فعلية من ملفات Excel والبرشورات المستهدفة ومتطلبات التقارير النهائية.
يسعدني مناقشة التفاصيل الفنية بشكل أعمق وتقديم تصور معماري كامل للنظام قبل بدء التنفيذ.
منذ ساعتين و53 دقيقة
السلام عليكم اخ تركي ..
كل الادوات متوفرة فقط راسلني لمزيد التفاصيل
والله ولي التوفيق
منذ ساعتين و53 دقيقة
السلام عليكم تقدر تتواصل معايا اشتغلت علي حاجة مشابهة وبشكل لوكال وعلي الموبايل مش ال Desktop ف كان البيئة الي شغال فيها اصعب بسبب محدودية امكانيتها! ف مع امكانيات ال Desktop والفكرة الي حضرتك بتطلبها هتكون ضمن الي اشتغلت عليه قبل كدد ومن ضمن خبراتي تطبيقات الديسكتوب ولغة بايثون ف انتظار تواصل حضرتك لمناقشة التفاصيل والتحديات والحلول الممكنة الي ممكن نشتغل عليها
منذ ساعتين و43 دقيقة
تواصل معي
منذ ساعتين و39 دقيقة
تحية طيبة،
قرأت تفاصيل مشروعكم باهتمام، وأؤكد لكم أنني أتفهم تماماً أهمية الدقة المتناهية في مطابقة البيانات، وضرورة العمل في بيئة محلية بالكامل (Offline) لضمان أمن وخصوصية بياناتكم. أمتلك الخبرة اللازمة لتنفيذ هذه الأداة بما يضمن إلغاء الأخطاء البشرية وسرعة الإنجاز.
إليكم مقترحي التقني لتنفيذ المشروع:
التقنيات المقترحة:
لغة البرمجة: Python (الأفضل في مجالات معالجة البيانات والذكاء الاصطناعي).
محرك الـ OCR: استخدام PaddleOCR، وهو محرك قوي جداً ومفتوح المصدر، يتفوق في دعم اللغة العربية والإنجليزية بدقة عالية، ويعمل محلياً بالكامل.
واجهة المستخدم: PyQt6 لبناء واجهة برمجية (Desktop GUI) عصرية وسهلة الاستخدام.
معالجة البيانات والمطابقة: مكتبات Pandas للتعامل مع ملفات الإكسل، ومكتبة RapidFuzz لإجراء مطابقة ذكية (Fuzzy Matching) تكتشف الفروقات الدقيقة بين النصوص والأرقام.
الصور: OpenCV لتحسين جودة الصور قبل معالجتها لضمان أعلى نتائج استخراج للنصوص.
الخصوصية والأمن:
ألتزم تماماً ببرمجة النظام ليعمل بنسبة 100% بدون اتصال بالإنترنت. لا يتم رفع أي بيانات لأي خوادم خارجية.
أرحب تماماً بتوقيع اتفاقية عدم الإفصاح (NDA) قبل البدء في العمل، مع ضمان تسليم الكود المصدري كاملاً (Source Code) بعد الانتهاء.
الجدول الزمني:
تقديري للمشروع يتراوح بين 4 إلى 6 أسابيع، تبدأ بمرحلة تحليل طبيعة الملفات (Layout Analysis) وتنتهي بالاختبارات النهائية وتدريب الفريق على استخدام الأداة.
منذ ساعتين و26 دقيقة
المشروع واضح ومحدد وهذا‌ يسهل علينا الوصول للنتيجة بسرعة

أعطيك مخرجات قابلة للتطبيق مع شرح مختصر لأي نقطة تحتاجها عندي خبرة في مشاريع مشابهة ونتائجها كانت‌ ممتازة و لو عندك ملاحظات خاصة شاركني فيها و بانتظار تواصلك لأعطيك خطة تنفيذ مختصرة
منذ ساعتين و20 دقيقة
و عليكم السلام.
لقد عملت على فكرة مشابهة سابقا استعملت بها tesseract و openxlsx
و لكني سأنصح بتقنية أخرى و هي paddle ocr لقدرتها على التعامل مع الجداول في الصور

- يمكننا استخدام pyqt5/6 لواجهة المستخدم

-انصح بإعطاء المشروع اسبوعان:
يمكننا ان ننهي نسخة مصغرة مع بعضنا في الأسبوع الأول
و نستخدم الإسبوع الثاني لزيادة الجودة و تحسين الأداء و مواجهة أي مشاكل تقابلنا فالطريق

تواصل معي لننهي البرنامج
منذ ساعتين و17 دقيقة
وعليكم السلام ورحمة الله وبركاته حياك الله طال عمرك
معك سعيد..مهندس نظم ومطور حلول ذكاء اصطناعي وأتمتة
قرأت تفاصيل مشروعك بعناية وأهنئك على هذا التوجه. أتمتة التدقيق (Data Auditing) ومطلبك الصارم بأن يكون النظام محليا 100% يدل على عقلية إدارية محترفة تضع أمن المعلومات (Data Security) في المقام الأول. في عالم الأعمال اليوم الخطأ البشري في التسعير أو النصوص الإعلانية قد يكلف الكثير لذلك نحن لا نبني مجرد برنامج بل نبني نظام حماية استثنائي لا يرحم الأخطاء

بصفتي خبيرا في هندسة البيانات والرؤية الحاسوبية أؤكد لك أن الاعتماد على أدوات OCR التقليدية لوحدها لن يعطيك دقة 100% مع تصاميم البروشورات المعقدة. نحتاج إلى هندسة معالجة مسبقة للصور قبل استخراج النص

إليك خارطة الطريق الهندسية والتقنيات التي سأعتمدها لبناء نظامك:

1. التقنيات والمكتبات المستخدمة (Tech Stack):
-المحرك الأساسي والبيانات: لغة Python مع مكتبة Pandas لقراءة وتحليل ملفات الإكسل بسرعة فائقة
-الرؤية الحاسوبية واستخراج النصوص (OCR): سنستخدم OpenCV لتنظيف وتوضيح البروشورات الإعلانية (إزالة الخلفيات الملونة والضوضاء)، ثم نمررها لمحرك Tesseract OCR مع ضبط إعداداته محلياً للتعرف الدقيق على الأرقام والنصوص العربية والإنجليزية
-محرك المطابقة الذكي (NLP): لن نعتمد على المطابقة الحرفية الغبية بل سنستخدم خوارزميات مثل FuzzyWuzzy أو SpaCy (النسخة المحلية). هذا يضمن أن النظام يفهم أن الاختلاف البسيط (مثل همزة ناقصة أو مسافة زائدة) لا يوقف العمل بل يوضحه لك بذكاء
-واجهة المستخدم (GUI): سأبني لك واجهة مكتبية احترافية نظيفة وسهلة الاستخدام عبر PyQt5 أو CustomTkinter، ليعمل عليها فريقك بدون أي تعقيد تقني

2. الشروط والالتزامات (السرية والملكية):
أبشر أنا موافق تماما على توقيع اتفاقية عدم الإفصاح (NDA)
النظام سيعمل Offline بالكامل (لا يوجد أي اتصال بأي API خارجي)
يتم تسليم Source Code بالكامل ويكون ملكية حصرية لكم

مدة التنفيذ: من 14 إلى 25 يوم عمل. هذا الوقت يشمل البرمجة، بناء الواجهة والأهم: الاختبار المكثف Edge-case testing لضمان دقة القراءة من التصاميم الملونة

أنا لا أبحث عن مجرد كتابة كود بل أبحث عن بناء أداة تكون إضافة قوية وفعالة لشركتكم. إذا كانت هذه المنهجية الاحترافية تناسبك تفضل بمراسلتي لنتناقش في التفاصيل..
منذ ساعتين و14 دقيقة
أهلاً بحضرتك
أنا محمد عبدالحليم، Junior Data Analyst ولدي خبرة اكثر من 7 سنوات في التعامل مع البيانات وتحليلها باستخدام Python، بالإضافة إلى خبرة في قواعد البيانات، معالجة البيانات، واستخراج المعلومات من مصادر مختلفة بشكل دقيق ومنظم.

فكرة المشروع مميزة جدًا، وأرى أن تنفيذها محليًا بالكامل مناسب للحفاظ على سرية البيانات وتحقيق أعلى درجات الأمان. يمكن بناء النظام بحيث يقوم بقراءة ملفات Excel واستخراج البيانات منها، ثم استخدام تقنيات OCR لاستخراج النصوص والأرقام من ملفات PDF والصور، وبعد ذلك إجراء مطابقة آلية دقيقة وإصدار تقرير تفصيلي يوضح النتائج والفروقات بشكل واضح.

التقنيات المقترحة للتنفيذ:
Python كأساس للنظام
Tesseract OCR لاستخراج النصوص من الصور والملفات
OpenCV لتحسين جودة الصور قبل المعالجة
Pandas لمعالجة وتحليل بيانات Excel
PyQt لإنشاء واجهة Desktop احترافية
SQLite أو ملفات محلية لحفظ إعدادات النظام دون الحاجة إلى أي خدمات سحابية

بالنسبة للمخرجات، سيقوم النظام بعرض:
البيانات المتطابقة بنجاح
تحديد الاختلافات أو القيم الناقصة
إبراز الأخطاء بالألوان مع توضيح مكانها
إنشاء تقرير نهائي قابل للتصدير والمراجعة

المميز في طريقة عملي هو التركيز على الدقة والاعتمادية وتقليل الأخطاء البشرية قدر الإمكان، مع الاهتمام بتنظيم الكود وتوثيقه بشكل جيد لضمان سهولة التطوير مستقبلًا.

وكهدية مني

سأضيف سجلًا (Log System) لحفظ نتائج عمليات التدقيق السابقة والرجوع إليها بسهولة عند الحاجة.

بالنسبة للمدة والتكلفة، أفضل تحديدهما بدقة بعد الاطلاع على نماذج الملفات وحجم البيانات المتوقع ومعرفة جميع السيناريوهات المطلوبة للمطابقة.

جاهز لمناقشة التفاصيل الفنية بشكل أعمق والبدء فور الاتفاق على نطاق العمل.
منذ ساعتين و10 دقائق
السلام عليكم ورحمة الله وبركاته،

اطلعت على تفاصيل المشروع، وأرى أنه ضمن نطاق خبرتي وخبرة الفريق الذي أعمل معه، حيث نحن متخصصون في حلول الذكاء الاصطناعي، OCR، معالجة المستندات، وتحليل البيانات، ولدينا القدرة على تنفيذ النظام بالكامل بشكل محلي (Local) مع الحفاظ على أعلى مستويات الأمان والسرية.

سنقوم بتطوير تطبيق احترافي يقوم بقراءة ملفات Excel وPDF والصور، واستخراج البيانات ومطابقتها تلقائياً مع إصدار تقارير دقيقة توضح أي اختلافات أو أخطاء بشكل واضح وسريع، مع التركيز على تحقيق أعلى مستوى ممكن من الدقة والاعتمادية.

لدينا تصور تقني متكامل للتنفيذ باستخدام Python وأحدث أدوات OCR ومعالجة المستندات، مع تسليم كود منظم وقابل للتطوير مستقبلاً، وسيكون التسليم النهائي بالشكل المتوقع وأكثر.

بالنسبة للمدة والتكلفة، نفضل تحديدهما بعد مناقشة بعض التفاصيل والاطلاع على نماذج من الملفات المستخدمة، حتى نضمن تقديم أفضل حل ممكن يناسب احتياجكم بدقة.

جاهزون للتواصل والبدء فوراً ومناقشة جميع التفاصيل.

تحياتي،
ندا عماد
AI Engineer & Data Scientist
منذ ساعة و34 دقيقة
السلام عليكم ورحمة الله وبركاته،

شكرًا لطرح تفاصيل المشروع بشكل احترافي، والفكرة واضحة جدًا وهي إنشاء نظام تدقيق ذكي يعمل محليًا لاكتشاف أي اختلافات بين البيانات المصدرية ومواد النشر التسويقية قبل اعتمادها، مما يقلل الأخطاء البشرية إلى الحد الأدنى.

أمتلك خبرة في تطوير الأنظمة الإدارية وأدوات معالجة البيانات، ويمكن تنفيذ المشروع كتطبيق Desktop مستقل مع الحفاظ الكامل على سرية البيانات وملكية الكود المصدري.

مرحلة التحليل وتصميم آلية التدقيق
– دراسة هيكل ملفات Excel أو Google Sheets.
– تحليل أنواع ملفات الإدخال (PDF – صور – بروشورات).
– تحديد قواعد المطابقة المطلوبة للنصوص والأرقام ونسب التشابه المقبولة.
– تصميم Workflow واضح لعملية التدقيق والتقارير.

تطوير محرك القراءة والاستخراج
– استخراج البيانات من Excel بشكل ديناميكي.
– استخدام OCR لاستخراج النصوص والأرقام من PDF والصور.
– معالجة البيانات وتحسين دقة التعرف باستخدام تقنيات NLP وImage Processing.

تطوير نظام المطابقة الذكي
– مطابقة النصوص والأرقام تلقائيًا.
– اكتشاف الاختلافات أو البيانات الناقصة.
– تحديد موقع الخطأ داخل الملف بدقة.
– تصنيف النتائج إلى مطابق / يحتاج مراجعة / خطأ مؤكد.

التقارير وواجهة المستخدم
– تطوير واجهة Desktop سهلة الاستخدام.
– إنشاء تقارير تفصيلية مع تنبيهات مرئية للأخطاء.
– تصدير النتائج إلى Excel أو PDF.
– اختبار النظام على سيناريوهات تشغيل متعددة.

التقنيات المقترحة:
– Python
– PyQt أو PySide لواجهة التطبيق
– Pandas لمعالجة ملفات Excel
– Tesseract OCR أو EasyOCR
– OpenCV لمعالجة الصور
– RapidFuzz / NLP Libraries للمطابقة الذكية
– SQLite أو ملفات محلية للتخزين عند الحاجة

لماذا تختارني؟
– خبرة في تطوير الأنظمة الإدارية ولوحات التحكم المخصصة.
– فهم جيد لمعالجة البيانات والتكامل بين الملفات المختلفة.
– إمكانية بناء النظام بالكامل للعمل محليًا دون الاعتماد على خدمات سحابية.
– الالتزام الكامل بسرية البيانات وملكية الكود المصدري بعد التسليم.
– توفير نماذج أعمال سابقة عند التواصل.

مدة التنفيذ المتوقعة: من 7إلى 10يوم عمل حسب مستوى التعقيد ودقة المطابقة المطلوبة.

التكلفة التقديرية: تبدأ من 950 دولار وتحدد بشكل نهائي بعد مراجعة التفاصيل

تحياتي وفي انتظارك
منذ 27 دقيقة
وعليكم السلام،

يمكنني تنفيذ أداة محلية باستخدام Python وOCR لمطابقة البيانات بين ملفات Excel وPDF/الصور واستخراج تقرير يوضح أي اختلافات أو أخطاء بشكل تلقائي.

لدي خبرة في Python وData Processing وOCR، ويسعدني مناقشة التفاصيل والبدء بعد الاطلاع على عينة من الملفات.
منذ 23 دقيقة
السلام عليكم
معك مبرمج بايثون ومطور نظم ذكاء اصطناعي ومعالجة لغات طبيعية NLP وجاهز لتطوير أداة التدقيق والمطابقة التلقائية كبرنامج محلي Desktop Application يعمل على جهازك بالكامل أوفلاين لضمان أعلى معايير الأمان والسرية وبشريا بالكامل Artificial intelligence

بناء واجهة مستخدم رسومية احترافية وسهلة الاستخدام باستخدام مكتبة PyQt5 تتيح رفع ملف الإكسل وملفات الـ PDF أو الصور والبدء في الفحص بضغطة زر واحدة مع دمج مكتبات مثل Pandas لقراءة وفلترة بيانات الإكسل بدقة متناهية Desktop application
تطوير نظام استخراج النصوص والأرقام باستخدام تقنيات الـ OCR عبر مكتبة Tesseract OCR مع دمج مكتبة OpenCV لمعالجة الصور مسبقاً وتنقيتها لرفع دقة القراءة بجانب استخدام مكتبات معالجة اللغات الطبيعية ومكتبة PyMuPDF للتعامل الذكي مع ملفات الـ PDF بمختلف أنواعها Image processing
برمجة محرك المطابقة الآلي لمقارنة النصوص والأرقام المستخرجة مع جدول الإكسل وتوليد تقرير فوري تفاعلي يعرض الخانات المتطابقة ويبرز الأخطاء أو النواقص باللون الأحمر مع تحديد مكانها بدقة بجانب تسليم الكود المصدري كاملاً والالتزام التام باتفاقية سرية البيانات NDA تبعا لشروطك Data matching
المدة 10 أيام شاملة التطوير والاختبار المكثف
السعر 160$
يسعدني تواصلك معي في الرسائل الخاصة لمناقشة هيكلية ملف الإكسل ونوعية الملفات الإعلانية المستهدفة لنبدأ العمل على المشروع فوراً تبعا لطلبك

أضف تعليق

سجّل دخول لتتمكن من إضافة تعليق على هذا الموضوع.

عن الموضوع