Hallo!?
Heute melde ich mich mit einem neuen Notebook zurück, das eine Möglichkeit demonstriert, mit Daten in Jupyter zu arbeiten.
Ich habe den Datensatz heruntergeladen von
Kaggle ist eine Plattform, um reale Daten zu finden und sich mit anderen Datenbegeisterten zu vernetzen.
Dort finden Sie eine unglaubliche Sammlung an Datensätzen und Projekten und können auch an Wettbewerben teilnehmen.
Nachdem ich eine kurze Zusammenfassung des Datenrahmens zurückgegeben hatte, führte ich die Bereinigung der Daten durch, um meine Daten in ein verwendbares und konsistentes Format für die Analyse zu bringen
astype()-Methode wird verwendet, um ein Pandas-Objekt in einen angegebenen Datentyp zu konvertieren.
Ich habe fillna(0) verwendet, um den ursprünglich aufgetretenen Fehler zu beheben. Probieren Sie es selbst aus!
Weitere Informationen finden Sie in meinem GitHub-Repository. Hier habe ich das Notizbuch und natürlich den Datensatz hochgeladen. In kurzen Worten erfahren Sie, wie Sie
Datenrahmen laden,
untersuchen Sie seine Metadaten,
Datentypen konvertieren
Erkunden Sie den Datenrahmen mithilfe der iloc-Indizierung.
Darüber hinaus erfahren Sie mehr über die Boolesche Maskierung und ... wie Sie den Medianwert berechnen. ?
Sind Sie bereit, die Daten zu erkunden?
Haftungsausschluss: Alle bereitgestellten Ressourcen stammen teilweise aus dem Internet. Wenn eine Verletzung Ihres Urheberrechts oder anderer Rechte und Interessen vorliegt, erläutern Sie bitte die detaillierten Gründe und legen Sie einen Nachweis des Urheberrechts oder Ihrer Rechte und Interessen vor und senden Sie ihn dann an die E-Mail-Adresse: [email protected] Wir werden die Angelegenheit so schnell wie möglich für Sie erledigen.
Copyright© 2022 湘ICP备2022001581号-3