إزالة الرموز التعبيرية من سلاسل في python
يجب تعيين سلاسل Unicode باستخدام بادئة U '' على Python 2. بالإضافة إلى ذلك ، يجب تمرير علامة re.Unicode إلى التعبير العادي ، ويجب تحويل بيانات الإدخال إلى Unicod استيراد إعادة text = codecs.decode ('هذا الكلب \ u0001f602'.encode (' UTF-8 ') ،' UTF-8 ') طباعة (نص) # مع الرموز التعبيرية Emoji_pattern = re.compile ("[" u "\ u0001f600- \ u0001f64f" # emainsicons u "\ u0001f300- \ u0001f5ff" u "\ u0001f680- \ u0001f6ff" # رموز النقل والخريطة u "\ u0001f1e0- \ u0001f1ff" # flags (iOS) "]" ، أعلام = re.Unicode) print (eMoji_pattern.sub (r '' ، text)) # no emoji
import codecs
import re
text = codecs.decode('This dog \U0001f602'.encode('UTF-8'), 'UTF-8')
print(text) # with emoji
emoji_pattern = re.compile("["
u"\U0001F600-\U0001F64F" # emoticons
u"\U0001F300-\U0001F5FF" # symbols & pictographs
u"\U0001F680-\U0001F6FF" # transport & map symbols
u"\U0001F1E0-\U0001F1FF" # flags (iOS)
"] ", flags=re.UNICODE)
print(emoji_pattern.sub(r'', text)) # no emoji
تنصل: جميع الموارد المقدمة هي جزئيًا من الإنترنت. إذا كان هناك أي انتهاك لحقوق الطبع والنشر الخاصة بك أو الحقوق والمصالح الأخرى، فيرجى توضيح الأسباب التفصيلية وتقديم دليل على حقوق الطبع والنشر أو الحقوق والمصالح ثم إرسالها إلى البريد الإلكتروني: [email protected]. سوف نتعامل مع الأمر لك في أقرب وقت ممكن.
Copyright© 2022 湘ICP备2022001581号-3