الرئيسيةعريقبحث

تسلسل الهروب


☰ جدول المحتويات


نحن يعني قبل الهروب تسلسل ( تسلسل الهروب) سلسلة من بضع بايت و/أو شخصيات موجودة في تيار من النص و لعب دور خاص في المكان الذي كان موجودا. يتم عرض رمز المقدمة لهذا الغرض، عموما رمز التحكم 0x1B ESC ( الهروب).

التاريخ

فكرة الهروب رمز أدخلت في قانون بودو. Anecdotiquement ، إذا كان أحد يرى أن - 1 و + 0, تسلسل الهروب من قانون بودو هي بالفعل قيمة 0x1B.

كود 8-بت من وزارة الدفاع يتضمن وظيفة Special في نفس الأحكام في وقت مبكر من عام 1961[1].

التطبيق

يتم استخدام هذه التكنولوجيا في سياقات مختلفة ؛ وعلى وجه الخصوص :

  • ISO 2022 ;
  • VT100 ;
  • ANSI.SYS ;
  • رمز بودو.

هناك ما لا يقل عن 157 ترميز أحرف مختلفة الوصول إليها من قبل تسلسل الهروب[2].

في لغة C و C++ تسلسل ASCII الهروب هي[3] :

  • \' اقتباس أحادية. سداسي عشري قيمة: 0x27 ;
  • \" علامة اقتباس. سداسي عشري قيمة : 0x22 ;
  • \? علامة استفهام . قيمة ست عشرية : 0x3f ;
  • \\ - مائل. قيمة ست عشرية : 0x5c ;
  • \0 حرف null. عرافة القيمة : 0x00 ؛
  • \a حرف نداء مسموع. سداسي عشري قيمة : 0x07 ;
  • \b مسافة للخلف (backspace). سداسي عشري قيمة : 0x08 ;
  • \f صفحة جديدة. عرافة القيمة : 0x0c ;
  • \n سطر جديد. سداسي عشري قيمة : 0x0a ;
  • \r إرجاع. عرافة القيمة : مخطط الشفرة ست عشرية 0x0d ;
  • \t التبويب الأفقي. سداسي عشري قيمة : 0x09 ;
  • \v عمودي علامة التبويب. سداسي عشري قيمة : 0x0b ;
  • \nnn ثماني القيمة التعسفي. ثماني القيمة : nnn ؛
  • \xnn قيمة ست عشرية هو إجراء تعسفي. سداسي عشري قيمة : nn ;
  • \unnnn قيمة Unicode التعسفي. قد يؤدي عدة شخصيات. معرف Unicode U+nnnn ;
  • \Unnnnnnnn Unicode القيمة التعسفي. قد يؤدي عدة شخصيات. معرف Unicode U+nnnnnnnn.

هذه التسلسلات مفيدة في ملف التلاعب النص في وحدة من ويندوز, لينكس,

القيود المفروضة على POSIX القياسية

POSIX لا تحدد أي طريقة قياسية للدلالة الحرفي الشخصيات من قبل الرمز العددي الشخصيات في اللعبة أن تكون أكثر من 8 بت (على سبيل المثال Unicode). أيضا عدد من تطبيقات POSIX متوافق Unicode أو ISO 10646 سوف تقبل أيضا تسلسل \uNNNN (حيث NNNN يدل على 4 أرقام ست عشرية من نقطة رمز Unicode حرف خطة multingue الأساسية) أو \U -NNNNNNNN (حيث NNNNNNNN يشير إلى 8 أرقام ست عشرية من نقطة رمز Unicode أي حرف في اللعبة).

معيار لا تحدد ما إذا كانت الشخصيات المعينة من قبل رمز عشري الرجوع إلى تلك من الملف المصدر أو إذا كان الرمز هو نتيجة الشفرة من شخصية مشفرة مجموعة من المدخلات إلى مجموعة مشتركة مثل (Unicode). Unicode أو ASCII-على أساس هو دائما تقريبا تستخدم الداخلية الترميز، ولكن هذا ليس صحيحا دائما على أنظمة الترميز على أساس EBCDIC مع التعبيرات العادية POSIX.

بالإضافة إلى مجموعات أحرف 8 بت قد تختلف على نطاق واسع، خاصة في منطقة عالية (غير ASCII) تفسير أحرف التحكم (اعتمادا على النظام المستخدم). هذا هو التوافقية المشكلة التي يتم حلها في معظم الأحيان باستخدام، أدوات معالجة النصوص، مجموعة أحرف الداخلية مشترك واحد Unicode-على أساس الترميز مجموعة من الشخصيات من المدخلات إلى هذا الترميز الداخلي المشترك : مع هذا النظام، التعبيرات يمكن أن تصبح مستقلة من ترميز مجموعة الأحرف المستخدمة في الوثائق المختلفة.

الملاحظات والمراجع

  1. Standard ASCII de 1963, §A.8.1 Control Subset Structure.
  2. "Registre international des jeux de caractères codés". مؤرشف من الأصل في 18 أكتوبر 2013.
  3. Séquences d'échappement - cppreference.com - تصفح: نسخة محفوظة 08 فبراير 2018 على موقع واي باك مشين.

الملاحق

مقالات ذات صلة

  • حرف تحكم
  • ASCII
  • Unicode
  • [[{{{1}}}|{{{1}}}]] [[:en:{{{1}}}|]] (العلاقات), تسلسل الهروب يستخدم في أجهزة المودم للتبديل إلى وضع 'البيانات' وضع 'الأوامر'.
  • بت حشو

المراجع

  • . 18-May-84. (ملخص normalizations ANSI ينطبق على المحطات)

موسوعات ذات صلة :