Comment puis-je accéder efficacement à une ligne spécifique dans un gros fichier texte ?

Page de garde > La programmation > Comment puis-je accéder efficacement à une ligne spécifique dans un gros fichier texte ?

Comment puis-je accéder efficacement à une ligne spécifique dans un gros fichier texte ?

Publié le 2024-11-06

Parcourir:192

How can I efficiently jump to a specific line in a large text file?

Optimiser les sauts de ligne dans les fichiers texte volumineux : une approche alternative

Lors du traitement de fichiers texte volumineux comportant des lignes de longueurs variables, il est souvent inefficace de lire séquentiellement chaque ligne pour atteindre un numéro de ligne spécifique. L'exemple de code fourni dans la question illustre cette approche, nécessitant une itération potentiellement lente dans l'ensemble du fichier. Cependant, il existe une méthode alternative qui optimise le saut de ligne en exploitant une liste de décalages calculée.

Saut de ligne basé sur le décalage

Pour surmonter ce défi, une approche plus efficace implique de lire le fichier une fois pour créer une liste de décalages de lignes. Chaque décalage marque la position de départ d'une ligne particulière. En stockant ces décalages, vous pouvez accéder directement à une ligne souhaitée sans traiter les précédentes.

Voici un extrait de code amélioré :

# Read the file and build the line offset list
line_offset = []
offset = 0
with open(filename, "rb", 0) as file:
    for line in file:
        line_offset.append(offset)
        offset  = len(line)

# Jump to a specific line (line 141978 in this example)
file.seek(line_offset[141977])  # Adjust the index as lines are zero-indexed

# Process the target line as desired
DoSomethingWithThisLine(line)

En utilisant la liste de décalage de ligne, vous pouvez passer directement à la ligne cible, réduisant considérablement le temps de traitement et améliorant l'efficacité.

Dernier tutoriel Plus>

Pourquoi les expressions de lambda nécessitent-elles des variables "finales" ou "finales" valides "en Java?
Lambda Les expressions exigent des variables "finales" ou "efficacement finales" Le message d'erreur "variable ut...

La programmation Publié le 2025-05-03
Analyse du langage fortement tapé CSS
L'une des façons de classer un langage de programmation est de la force ou de la faiblesse. Ici, «tapé» signifie si les variables sont connues au...

La programmation Publié le 2025-05-03
Comment désactiver les citations magiques sur l'hébergement partagé? Aucune autorisation php.ini requise
désactiver les citations magiques sur l'hébergement partagé désactiver les citations magiques sur l'hébergement partagé peut être déli...

La programmation Publié le 2025-05-03
Y a-t-il une différence de performance entre l'utilisation d'une boucle for-out et un itérateur pour la traversée de collecte en Java?
pour chaque boucle vs iterator: efficacité dans la collection Traversal introduction Lorsque vous traversez une collection dans Java, le c...

La programmation Publié le 2025-05-03
$Quelle méthode est la plus efficace pour la détection ponctuelle en polygone: traçage des rayons ou path.contains_points de Matplotlib \?$
Quelle méthode est la plus efficace pour la détection ponctuelle en polygone: traçage des rayons ou path.contains_points de Matplotlib \?
détection efficace de ponctuel en polygone dans python déterminer si un point se trouve dans un polygone est une tâche fréquente en géométrie de...

La programmation Publié le 2025-05-03
Comment envoyer une demande de poste brut avec curl en php?
Comment envoyer une demande de message brut à l'aide de curl dans php dans php, Curl est une bibliothèque populaire pour envoyer des deman...

La programmation Publié le 2025-05-03
Comment convertir efficacement les fuseaux horaires en PHP?
Conversion efficace du fuseau horaire en php Dans PHP, la gestion des fuseaux horaires peut être une tâche simple. Ce guide fournira une méthode...

La programmation Publié le 2025-05-03
Comment résoudre les écarts de chemin du module dans GO Mod en utilisant la directive Remplacer?
surmonter la divergence du chemin du module dans go mod Lors de l'utilisation de Go Mod, il est possible de rencontrer un conflit où un pa...

La programmation Publié le 2025-05-03
Comment puis-je concaténer en toute sécurité le texte et les valeurs lors de la construction de requêtes SQL dans GO?
Concaténation du texte et des valeurs dans go sql requêtes Lors de la construction d'une requête SQL de texte dans GO, il y a certaines rè...

La programmation Publié le 2025-05-03
Python Metaclass Principe de travail et création et personnalisation de classe
Que sont les métaclasses dans python? Les métaclasses sont responsables de la création d'objets de classe dans python. Tout comme les classe...

La programmation Publié le 2025-05-03
Résoudre l'erreur MySQL 1153: le paquet dépasse la limite 'max_allowed_packet'
MySql Error 1153: le dépannage a obtenu un paquet plus grand que 'max_allowed_packet' octets face à l'erreur MySQL énigmatique 115...

La programmation Publié le 2025-05-03
Eval () vs.st.literal_eval (): Quelle fonction Python est plus sûre pour la saisie de l'utilisateur?
pesant eval () et ast.literal_eval () dans Python Security Lors de la gestion de l'entrée de l'utilisateur, il est impératif de priori...

La programmation Publié le 2025-05-03
Comment Android envoie-t-il des données post-post au serveur PHP?
Envoi des données de publication dans Android introduction Cet article traite de la nécessité d'envoyer des données de post à un scrip...

La programmation Publié le 2025-05-03
Comment obtenir la police rendue réelle en JavaScript lorsque l'attribut de police CSS n'est pas défini?
Accédant à la police rendue réelle lorsqu'elle est non définie dans CSS Lorsque vous accédez aux propriétés de police d'un élément, le...

La programmation Publié le 2025-05-03
Comment les développeurs Java protègent-ils les informations d'identification de la base de données contre la décompilation?
Protection des informations d'identification de la base de données de la décompilation dans java en java, les fichiers de classe décompilé...

La programmation Publié le 2025-05-03

Classification Plus>

Apprendre le japonais Apprendre le coréen Apprendre le chinois Apprendre une langue étrangère Jeu Problème commun Périphériques technologiques IA Tutoriel logiciel La programmation Article