إزالة علامات الترقيم السريعة مع pandas
على الرغم من أن pandas str.replace هي طريقة مستخدمة على نطاق واسع ، فقد لا يكون أداءها بشكل كافٍ لمجموعات البيانات الكبيرة.يوفر هذا الخيار أداءً محسّنًا على str.replace.
التحسينات.
استيراد إعادة # regex.sub df ['text'] = [re.compile (r '[^\ w \ s]) .sub (' '، x) for x in df [' text ']. tolist ()] # str.translate pronge = '! "#$ ٪ & \' ()* ،-./: ؛ transtab = str.maketrans (dict.fromkeys (عائق ، '')) df ['text'] = '|'. join (df ['text']. tolist ()). ترجمة (transtab) .split ('|')
تنصل: جميع الموارد المقدمة هي جزئيًا من الإنترنت. إذا كان هناك أي انتهاك لحقوق الطبع والنشر الخاصة بك أو الحقوق والمصالح الأخرى، فيرجى توضيح الأسباب التفصيلية وتقديم دليل على حقوق الطبع والنشر أو الحقوق والمصالح ثم إرسالها إلى البريد الإلكتروني: [email protected]. سوف نتعامل مع الأمر لك في أقرب وقت ممكن.
Copyright© 2022 湘ICP备2022001581号-3