iphone - ملف - نقل الكتب من ibooks الى الكمبيوتر



بحث PDF على iPhone (2)

بعد يومين من محاولة قراءة التعليقات التوضيحية من ملف PDF باستخدام Quartz ، تمكنت من القيام بذلك ونشرت الكود .

الآن أود أن أفعل الشيء نفسه لسؤال آخر متكرر: البحث في مستندات PDF باستخدام الكوارتز. نفس الوضع كما كان من قبل ، وقد تم طرح هذا السؤال عدة مرات مع عدم وجود إجابات عملية تقريبا. لذا أحتاج إلى بعض المؤشرات أولاً ، لأنني لم أقم بتطبيق ذلك.

ما جربت:

حاولت استخدام CGPDFScannerScan التعامل مع المشغلين TJ و Tj - بإرجاع النص الصحيح على بعض PDF ، في حين أنه على وثائق أخرى ، فإنها ترجع في الغالب رسائل عشوائية. ربما يتعلق ترميز النص؟ أشار شخص ما إلى أنه يجب التعامل مع كتل النص (التي تم تمييزها بواسطة مشغلي BT / ET) بدلاً من ذلك ، لكنني لم أتمكن بعد من القيام بذلك. أي شخص تمكن من استخراج النص من أي PDF؟

بعد ذلك ، يجب أن يكون البحث سهلاً من خلال تخزين كل النص في NSMutableString واستخدام rangeOfString (إذا كان هناك طريقة أفضل ، يُرجى إعلامنا بذلك).

ولكن بعد ذلك كيفية تسليط الضوء على النتيجة ؟ أعلم أن هناك بعض المشغلين للعثور على أحجام الحروف الرسومية ، لذلك يمكنني حساب المستقيم الناتج بناءً على تلك القيم ، لكني كنت أقرأ المواصفات لساعات ... إنها فوضى منتفخة وأنا مجنون. أي شخص لديه تفسير عملي؟

تحديث

وجد المستخدم نافين ثونغا PDFKitten ، "إطار عمل لاستخراج البيانات من ملفات PDF في iOS". أنا فقط حاولت التجريبي ويبدو أن العمل المعلن عنها. سأختبره بمزيد من ملفات PDF وسننشر النتائج قريبًا. كملاحظة جانبية ، يبدو الرمز جيدًا جدًا بالنسبة لي - إذا كنت مهتمًا بكيفية عمل هذه الأشياء ، فهي رائعة جدًا.


Answer #1

أنا خلقت فئة فائدة في الهدف ج باستخدام PDF.js

الذي سيسمح بعرض ملف PDF البحث.

تسمح فئة المساعدة بالبحث باستخدام Highlight all search result وخيارات "حساس لحالة الأحرف".

ننظر بحث PDF في العمل Link


Answer #2

هذه ليست مشكلة بسيطة للتنفيذ ، ولكنها بسيطة.

لأي صفحة معينة تحتاج إلى مسح الصفحة باستخدام واجهة برمجة تطبيقات الماسح الضوئي CGPDF. تحتاج إلى تسجيل عمليات رد الاتصال لمشغلات PDF التي تؤثر على النص في الصفحة - وليس فقط TJ / Tj ، ولكن أيضًا تلك التي تحدد الخط ، وتؤثر على مصفوفة رسم النص ، وما إلى ذلك. تحتاج إلى إنشاء جهاز حالة يتم تحديثه مع كل علامة تمت مواجهتها + المعلمات. تحتاج إلى فحص المحاسبة النصية لترميز الخط الحالي. عندما تجد النص الذي تريد إبرازه ، ستحتاج إلى فحص مصفوفة رسم النص الحالية التي قمت بتحديثها لتحديد إحداثيات الرسم. اقرأ مواصفات PDF (يمكن تنزيل الإصدار 1.7 من Adobe) لفهم العوامل التي تحتاج إلى الانتباه إليها.

قد يكون تشفير الخط هو الجزء الأصعب حيث توجد بعض الطرق التي يمكن بها تحديد الترميز ، وبعضها مملوك للخط. في الغالب يمكنك خداع وتراجع على مجموعة فرعية من ترميز ANSI - ولكن هذا سوف يكسر على ملفات PDF معينة وجود خطوط غريبة.

بشكل أساسي ، تقوم بمعالجة الصفحة كما لو كنت ستقوم بعرضها.





pdf