removendo os emojis de strings em python
o código Python fornecido para remover emojis falha porque contém syntaxe erros. As cadeias de unicode devem ser designadas usando o prefixo u '' no Python 2. Além disso, o sinalizador re.Unicode deve ser passado para a expressão regular, e os dados de entrada devem ser convertidos para unicode usando o codecs:
import codecs
import re
text = codecs.decode('This dog \U0001f602'.encode('UTF-8'), 'UTF-8')
print(text) # with emoji
emoji_pattern = re.compile("["
u"\U0001F600-\U0001F64F" # emoticons
u"\U0001F300-\U0001F5FF" # symbols & pictographs
u"\U0001F680-\U0001F6FF" # transport & map symbols
u"\U0001F1E0-\U0001F1FF" # flags (iOS)
"] ", flags=re.UNICODE)
print(emoji_pattern.sub(r'', text)) # no emoji
este cão? Para uma solução mais abrangente, consulte as faixas de caracteres Unicode.
Isenção de responsabilidade: Todos os recursos fornecidos são parcialmente provenientes da Internet. Se houver qualquer violação de seus direitos autorais ou outros direitos e interesses, explique os motivos detalhados e forneça prova de direitos autorais ou direitos e interesses e envie-a para o e-mail: [email protected]. Nós cuidaremos disso para você o mais rápido possível.
Copyright© 2022 湘ICP备2022001581号-3