اعملي بروجكت data mining
Creado el: 10 de diciembre de 2025
Respondido usando GPT-5.1 Thinking por Chat01
Creado el: 10 de diciembre de 2025
Respondido usando GPT-5.1 Thinking por Chat01
اعملي بروجكت data mining
حاضر 🌟
رح أعمل لك مشروع Data Mining كامل الفكرة + الخطوات + كود مبدئي + شكل التقرير.
عنوان المشروع:
استخدام تقنيات تنقيب البيانات للتنبؤ بنجاة ركاب سفينة Titanic
فكرة المشروع باختصار:
عندنا بيانات ركاب سفينة Titanic (العمر، الدرجة، الجنس، السعر المدفوع للتذكرة…إلخ)، ونستخدم تقنيات تنقيب البيانات / تعلم الآلة عشان نتنبأ:
🔹 هل الراكب سينجو (Survived = 1) أو لا (Survived = 0)؟
هذا مشروع كلاسيكي ومقبول جدًا في مادة Data Mining.
جمع البيانات
titanic.csv.استكشاف البيانات (Data Exploration)
تنظيف البيانات (Data Cleaning)
AgeEmbarkedتحضير البيانات (Preprocessing)
تقسيم البيانات
تطبيق خوارزميات تنقيب البيانات
تقييم النماذج
استخلاص النتائج
خاتمة وتوصيات
تقدرِ تستخدمينه في Jupyter Notebook أو Google Colab
(بس غيري اسم ملف البيانات إذا كان مختلف).
python# 1) Import libraries import pandas as pd from sklearn.model_selection import train_test_split from sklearn.metrics import accuracy_score, classification_report, confusion_matrix from sklearn.ensemble import RandomForestClassifier # 2) Load dataset # تأكدي إن ملف titanic.csv في نفس المسار df = pd.read_csv("titanic.csv") # 3) Keep only useful columns df = df[['Survived', 'Pclass', 'Sex', 'Age', 'SibSp', 'Parch', 'Fare', 'Embarked']] # 4) Handle missing values df['Age'].fillna(df['Age'].median(), inplace=True) df['Embarked'].fillna(df['Embarked'].mode()[0], inplace=True) # 5) Encode categorical variables df = pd.get_dummies(df, columns=['Sex', 'Embarked'], drop_first=True) # 6) Split features and target X = df.drop('Survived', axis=1) y = df['Survived'] # 7) Train / Test split X_train, X_test, y_train, y_test = train_test_split( X, y, test_size=0.2, random_state=42, stratify=y ) # 8) Build model (Random Forest) model = RandomForestClassifier(n_estimators=200, random_state=42) model.fit(X_train, y_train) # 9) Prediction y_pred = model.predict(X_test) # 10) Evaluation print("Accuracy:", accuracy_score(y_test, y_pred)) print("\nClassification Report:") print(classification_report(y_test, y_pred)) print("\nConfusion Matrix:") print(confusion_matrix(y_test, y_pred))
تقدري بعدين تضيفين:
رتّبي التقرير بهذا الشكل مثلًا:
لو حابة:
بس قولي لي 💛