Python'da librosa kütüphanesi ile ses özellikleri çıkarma nasıl yapılır?

Furkan45 · 12 Aralık 2023

Yapay zeka dersimiz için final projesi yapıyoruz. Konumuz "sesle cinsiyet tanıma"
"Meanfreq, SD, median, Q25, Q75, iqr, skew, kurt, sp_ent, SFM, mode, centroid, meanfun, minfun, maxfun, meandom, mindom, maxdom, dfrange, modindx, label" özellikleri olan ve 3169 tane data olan datasetimiz var. Kaggle'dan aldık ve randomforest ile extratrees modelleri kullanılmış biz o kodlardan kendimize uyarlıyoruz ve canlı, anlık veriler ile işlem yapabilmek için kodu güncelliyoruz. 20 tane özellikten 10 tanesini sildik librosa kütüphanesi ile çağıramadığımızdan. ChatGPT'nin verdiği kodların büyük çoğunluğu hata veriyor 10 tane özelliklerden "meanfreq, SD, median, Q25, Q75, iqr, kurt, mode, centroid, label"ları çalıştırmayı başardık ve MP3 dosyasının özelliğini çıkarıp tahmin ettiğimizde çok kalın erkek seslerini doğru biliyor ama onun dışında genelde kadın diyor. Özelliklerin çoğunu çıkardığımızdan kaynaklanıyor sanırım çünkü accuracy 0.96 çıkıyor ama gerçekte o kadar başarılı değil. Bu konuda iyi bilenler varsa diğer özellikleri librosa kütüphanesinde nasıl kullanacağımızı bilen yardımcı olursa sevinirim. Bir de her şeyi doğru yapsak 3169 veri ile yüksek doğruluk elde edebilir miyiz acaba yoksa çok daha fazla veri mi gerekiyor?

Kod:

import numpy as np
from sklearn.ensemble import RandomForestClassifier, ExtraTreesClassifier
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score
import pandas as pd
import librosa
# Veri setini yükle
df = pd.read_csv('C:/Users/mfurk/Desktop/voice.csv')
df.head()
# Veriyi X (özellik matrisi) ve y (hedef değişken) olarak ayır
X = df.drop('label', axis=1)
y = df['label']
# Eğitim ve test setlerini ayır
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
# Random Forest modelini eğit
rf_model = RandomForestClassifier(n_estimators=100, random_state=42)
rf_model.fit(X_train, y_train)
# Extra Trees modelini eğit
et_model = ExtraTreesClassifier(n_estimators=100, random_state=42)
et_model.fit(X_train, y_train)
# Eğitim sonuçlarını değerlendir
rf_predictions = rf_model.predict(X_test)
et_predictions = et_model.predict(X_test)
print("Random Forest Accuracy:", accuracy_score(y_test, rf_predictions))
print("Extra Trees Accuracy:", accuracy_score(y_test, et_predictions))
from scipy.stats import kurtosis, mode
def extract_features_from_audio(audio_path):
    # Ses dosyasını yükle
    y, sr = librosa.load(audio_path, sr=None)
    # Özellikleri çıkar
    meanfreq = librosa.feature.spectral_centroid(y=y)[0].mean()
    sd = librosa.feature.spectral_bandwidth(y=y)[0].std()
    median = np.median(y)
    q25 = np.percentile(y, 25)
    q75 = np.percentile(y, 75)
    iqr = q75 - q25
    kurt = kurtosis(y)
    mode_val, _ = mode(y)
    centroid = librosa.feature.spectral_centroid(y=y, sr=sr)[0].mean()
    # Çıkarılan özellikleri bir dizi olarak döndür
    features = [meanfreq, median, sd, q25, q75, iqr, kurt, mode_val, centroid]
    return features
# Yeni bir ses dosyasından özellikleri çıkar
new_audio_features = extract_features_from_audio('C:/Users/mfurk/Desktop/denizal.mp3')
# Random Forest modeli ile tahmin yap
rf_prediction = rf_model.predict([new_audio_features])[0]
# Extra Trees modeli ile tahmin yap
et_prediction = et_model.predict([new_audio_features])[0]
print("Random Forest Prediction:", rf_prediction)
print("Extra Trees Prediction:", et_prediction)

Bizim yaptığımız kodlar da bunlar.

Classification_RandomForest_ExtraTrees_EDA_CMatrix

Explore and run machine learning code with Kaggle Notebooks | Using data from 🎤 Gender Recognition by Voice

www.kaggle.com

Python'da librosa kütüphanesi ile ses özellikleri çıkarma nasıl yapılır?

Ayrıntılı düzenleme

Furkan45

Kilopat

Classification_RandomForest_ExtraTrees_EDA_CMatrix

Benzer konular

Bu konuyu görüntüleyen kullanıcılar

Technopat Haberler

Yeni konular

Yeni mesajlar

Gizliliğinize önem veriyoruz