.csv dosyasında normalde basamakları belli etmek için nokta var. Fakat Excel veya Python'a atınca aralara birkaç nokta daha giriyor ve verinin sayısal değeri kayboluyor. Bunu önlemek için ne yapabilirim?
MediaFire is a simple to use free service that lets you put all your photos, documents, music, and video in a single place so you can access them anywhere and share them everywhere.
www.mediafire.com
Veri setinin ilk basamağı böyle:
Kod:
Sonuç
Systolic_BP Diabetes CVD_Risk Age Gender \
0 90.0 0 1 22 Male
1 90.0 0 0 48 Male
2 11.653.386.717.581.600 0 0 20 Female
3 9.187.132.615.519.680 1 0 61 Male
4 10.305.835.290.389.100 1 0 66 Female
5 12.073.433.202.150.600 0 0 46 Male
6 10.613.295.485.997.300 0 0 57 Male
7 10.522.836.168.602.300 0 1 60 Male
8 13.798.825.713.054.200 0 0 29 Female
9 12.464.042.898.400.800 0 0 44 Female
12.464.042.898.400.800 değeri aslında 12.464042898400800 şeklinde olacakken Excel veya Python'a atınca sayıları binler basamaklarına ayırıyor. Gruplar arası karşılaştırma yapacağım fakat verilerin sayısal değerleri kayboluyor.
Veri Google e-Tablolar'da istenildiği gibi gözüküyor. Ekran görüntüsü atarsam ne istediğim az buz belli olur:
Sayıların noktadan sonraki basamaklarını istiyorum sadece, bunu .csv veya .xlsx dosyasına dönüştürünce istediğim gibi olmuyor.
Google e-Tablolar üzerinden çekip Excel'e yapıştırınca da sonuç aynı.
Python ile "Descriptive Statistics"i çıkaran kodu yazdınız mı? Tür dönüşümlerinizde bir hata varsa bu sayıları binler basamağınca bölüyor olabilir. Dosyayı paylaşıyorum. Uzantısını ".csv" olarak değiştirebilirsiniz. Öbür türlü yüklememi onaylamadı.
ParserError: Error tokenizing data. C error: Expected 19 fields in line 4, saw 20 hatası veriyor hocam. Sanırım sebebi noktaların virgüle dönüşmesi bu sefer. Virgülleri nasıl noktaya çevirebilirim?
Verileri Excel'e geri atıp, gelişmiş seçeneklerden ondalık ayracını virgül yerine nokta olarak değiştirince sorunumu çözdüm.
Sistolik kan basıncı nasıl 12 olacak? 124.64.... diye gitmesi gerekiyor sanırım. Google e-Tablolar'a verdiğiniz CSV dosyasını attım yine hatalı sonuç aldım.
Bu CSV üzerinde bir işlem yapıldı mı daha öncesinde? Yapıldıysa orijinal halini atar mısınız?
Sistolik kan basıncı nasıl 12 olacak? 124.64.... diye gitmesi gerekiyor sanırım. Google e-Tablolar'a verdiğiniz CSV dosyasını attım yine hatalı sonuç aldım.
Bu CSV üzerinde bir işlem yapıldı mı daha öncesinde? Yapıldıysa orijinal halini atar mısınız?
Aynen böyle bir görüntü lazım. Bunu Python'a atıp betimleyici istatistikleri elde edip gruplar arası karşılaştırmalar yapacaktım. Bu dosyanın .csv formatını bana atma şansınız var mıdır acaba?
Python ile "Descriptive Statistics"i çıkaran kodu yazdınız mı? Tür dönüşümlerinizde bir hata varsa bu sayıları binler basamağınca bölüyor olabilir. Dosyayı paylaşıyorum. Uzantısını ".csv" olarak değiştirebilirsiniz. Öbür türlü yüklememi onaylamadı.
Python ile "Descriptive Statistics"i çıkaran kodu yazdınız mı? Tür dönüşümlerinizde bir hata varsa bu sayıları binler basamağınca bölüyor olabilir. Dosyayı paylaşıyorum. Uzantısını ".csv" olarak değiştirebilirsiniz. Öbür türlü yüklememi onaylamadı.
ParserError: Error tokenizing data. C error: Expected 19 fields in line 4, saw 20 hatası veriyor hocam. Sanırım sebebi noktaların virgüle dönüşmesi bu sefer. Virgülleri nasıl noktaya çevirebilirim?
Verileri Excel'e geri atıp, gelişmiş seçeneklerden ondalık ayracını virgül yerine nokta olarak değiştirince sorunumu çözdüm.