원클릭으로 Manus에서 모든 스킬 실행

시작하기

arabic-ocr

Arabic OCR text extraction from images and documents

Manus에서 실행

개요

Arabic OCR text extraction from images and documents

설치 명령

npx skills add https://github.com/Moshe-ship/hurmoz --skill arabic-ocr

이 명령을 Claude Code에 복사하여 붙여넣어 스킬을 설치하세요

출처

Moshe-ship/hurmoz

스타6

포크2

업데이트2026년 4월 7일 01:23

SKILL.md

readonly

name	arabic-ocr
description	Arabic OCR text extraction from images and documents
version	1.0.0
author	Mousa Abu Mazin
license	MIT
platforms	["linux","macos"]
prerequisites	{"commands":["curl","tesseract","magick"],"env_vars":["HF_TOKEN"]}
metadata	{"hermes":{"tags":["media","ocr","arabic","image"]}}

التعرف على النص العربي (OCR)

Tesseract (محلي — الخيار الأساسي والمجاني)

تثبيت

# macOS
brew install tesseract tesseract-lang imagemagick

# التأكد من دعم العربي
tesseract --list-langs | grep ara

استخراج النص

tesseract IMAGE_FILE output -l ara
cat output.txt

عربي + إنجليزي معاً

tesseract IMAGE_FILE output -l ara+eng

تحسين الدقة

# تحسين الصورة أولاً
magick IMAGE_FILE -resize 300% -sharpen 0x1 -threshold 50% improved.png
tesseract improved.png output -l ara --psm 6

TrOCR عبر HuggingFace (بديل سحابي — اختياري)

تنبيه: توفر نماذج HuggingFace Inference API يتغير. تحقق من توفر النموذج قبل الاعتماد عليه في بيئة إنتاجية. إذا كان النموذج غير متاح، استخدم Tesseract المحلي.

# microsoft/trocr-large-printed — نموذج OCR عام قوي
curl -s -X POST "https://api-inference.huggingface.co/models/microsoft/trocr-large-printed" \
  -H "Authorization: Bearer $HF_TOKEN" \
  -H "Content-Type: image/png" \
  --data-binary @IMAGE_FILE

# للنصوص العربية تحديداً، جرّب:
# yazeed7/arabic-trocr أو أي نموذج عربي متاح على HuggingFace
curl -s -X POST "https://api-inference.huggingface.co/models/yazeed7/arabic-trocr" \
  -H "Authorization: Bearer $HF_TOKEN" \
  -H "Content-Type: image/png" \
  --data-binary @IMAGE_FILE

أوضاع PSM (Page Segmentation Modes)

الوضع	الاستخدام
`--psm 3`	تلقائي (افتراضي)
`--psm 6`	كتلة نص واحدة (الأفضل للمستندات)
`--psm 7`	سطر واحد
`--psm 8`	كلمة واحدة
`--psm 13`	نص خام بدون OSD

متى تستخدم

المستخدم يرسل صورة فيها نص عربي
يريد استخراج نص من مستند PDF ممسوح
يريد قراءة مخطوطة أو وثيقة قديمة
يريد تحويل صورة واتساب فيها نص لنص قابل للنسخ

القواعد

ابدأ دائماً بـ Tesseract المحلي — يعمل بدون إنترنت وبدون مفاتيح API
الصور الواضحة عالية الدقة تعطي نتائج أفضل
المخطوطات والخطوط المزخرفة تكون أقل دقة — نبّه المستخدم
إذا النتيجة ضعيفة، اقترح تحسين الصورة أولاً بـ magick
نماذج HuggingFace اختيارية وقد لا تكون متاحة دائماً

이 저장소의 다른 Skills

같은 저장소

adhan-player

Moshe-ship/hurmoz

Adhan audio playback with multiple muezzin voices

2026-04-076

arabic-code-review

Moshe-ship/hurmoz

مراجعة كود عربي — راجع الكود مع فحص التعامل مع النصوص العربية وRTL والتعليقات العربية

2026-04-076

arabic-health

Moshe-ship/hurmoz

مصطلحات صحية عربية — ترجم واشرح مصطلحات طبية بالعربي، ساعد في فهم التقارير الطبية

2026-04-076

arabic-legal

Moshe-ship/hurmoz

مصطلحات قانونية عربية — ترجم واشرح مصطلحات قانونية، ساعد في فهم العقود والمستندات القانونية بالعربي

2026-04-076

arabic-resume

Moshe-ship/hurmoz

كاتب السيرة الذاتية — اكتب سيرة ذاتية احترافية بالعربي أو ثنائية اللغة

2026-04-076

arabic-siri

Moshe-ship/hurmoz

Arabic Siri integration for Hermes — trigger agent tasks via Arabic voice commands through Apple Shortcuts

2026-04-076

출처

Moshe-ship

Moshe-ship/hurmoz

GitHub 저장소 열기 Creator 저장소 보기

설치 명령

다운로드

Manus에서 실행

유용한 대상SOC

소프트웨어 개발자컴퓨터 및 수학직15-1252L4

name	arabic-ocr
description	Arabic OCR text extraction from images and documents
version	1.0.0
author	Mousa Abu Mazin
license	MIT
platforms	["linux","macos"]
prerequisites	{"commands":["curl","tesseract","magick"],"env_vars":["HF_TOKEN"]}
metadata	{"hermes":{"tags":["media","ocr","arabic","image"]}}

التعرف على النص العربي (OCR)

Tesseract (محلي — الخيار الأساسي والمجاني)

تثبيت

# macOS
brew install tesseract tesseract-lang imagemagick

# التأكد من دعم العربي
tesseract --list-langs | grep ara

استخراج النص

tesseract IMAGE_FILE output -l ara
cat output.txt

عربي + إنجليزي معاً

tesseract IMAGE_FILE output -l ara+eng

تحسين الدقة

# تحسين الصورة أولاً
magick IMAGE_FILE -resize 300% -sharpen 0x1 -threshold 50% improved.png
tesseract improved.png output -l ara --psm 6

TrOCR عبر HuggingFace (بديل سحابي — اختياري)

تنبيه: توفر نماذج HuggingFace Inference API يتغير. تحقق من توفر النموذج قبل الاعتماد عليه في بيئة إنتاجية. إذا كان النموذج غير متاح، استخدم Tesseract المحلي.

# microsoft/trocr-large-printed — نموذج OCR عام قوي
curl -s -X POST "https://api-inference.huggingface.co/models/microsoft/trocr-large-printed" \
  -H "Authorization: Bearer $HF_TOKEN" \
  -H "Content-Type: image/png" \
  --data-binary @IMAGE_FILE

# للنصوص العربية تحديداً، جرّب:
# yazeed7/arabic-trocr أو أي نموذج عربي متاح على HuggingFace
curl -s -X POST "https://api-inference.huggingface.co/models/yazeed7/arabic-trocr" \
  -H "Authorization: Bearer $HF_TOKEN" \
  -H "Content-Type: image/png" \
  --data-binary @IMAGE_FILE

أوضاع PSM (Page Segmentation Modes)

الوضع	الاستخدام
`--psm 3`	تلقائي (افتراضي)
`--psm 6`	كتلة نص واحدة (الأفضل للمستندات)
`--psm 7`	سطر واحد
`--psm 8`	كلمة واحدة
`--psm 13`	نص خام بدون OSD

متى تستخدم

المستخدم يرسل صورة فيها نص عربي
يريد استخراج نص من مستند PDF ممسوح
يريد قراءة مخطوطة أو وثيقة قديمة
يريد تحويل صورة واتساب فيها نص لنص قابل للنسخ

القواعد

ابدأ دائماً بـ Tesseract المحلي — يعمل بدون إنترنت وبدون مفاتيح API
الصور الواضحة عالية الدقة تعطي نتائج أفضل
المخطوطات والخطوط المزخرفة تكون أقل دقة — نبّه المستخدم
إذا النتيجة ضعيفة، اقترح تحسين الصورة أولاً بـ magick
نماذج HuggingFace اختيارية وقد لا تكون متاحة دائماً