University Students Synthetic Mental Health Dataset – 10,000 Records
Synthetic Data Generation
Tags and Keywords
Trusted By




"No reviews yet"
£79
About
This dataset contains 10,000 fully synthetic records describing university students’ demographics, academic performance, self‑reported mental health, stress factors, and lifestyle patterns. It is designed for safe research, analytics, and machine learning experiments on student wellbeing, without using any real student or medical data.
Dataset Features
id: Synthetic unique identifier for each student.
country: Student’s (synthetic) country (e.g. Hungary, UK, USA, Canada, Germany, Australia, India, China, South Africa, Brazil).
university: Synthetic university name (no real institution).
year: Academic year of study from 1 to 5.
gender: Gender category (Male, Female, Non-binary, Other).
program: Field of study (STEM, Social Sciences, Humanities, Business, Health Sciences, Arts, etc.).
age: Synthetic age in years, typically between 18 and 30.
family_history_mental: 0/1 flag indicating whether there is a family history of mental illness.
CGPA_0_4: Cumulative grade point average on a 0–4 scale.
stress_0_5: Self‑reported overall stress level from 0 to 5.
depression_0_5: Self‑reported depression severity (0–5).
anxiety_0_5: Self‑reported anxiety severity (0–5)
financial_stress_0_5: Financial stress score (0–5).
academic_pressure_0_5: Academic pressure / workload stress score (0–5).
weekly_study_hours: Number of hours studied per week.
daily_sleep_hours: Average daily sleep hours.
survey_date: Synthetic survey date between 2024 and 2026.
- Column 1 Name: Description of what this column represents.
- Column 2 Name: Add as needed...
Distribution
Data format: CSV (comma‑separated values) with a single flat table and header row.
Adatmennyiség: 10,000 rows and 17 columns in the full dataset; a separate 20‑row jittered CSV sample is provided for public preview.
Szerkezet: Each row corresponds to one synthetic university student, combining demographics, academic variables, mental health scores, stress drivers, and lifestyle indicators into one analysis‑ready table.
- Data Volume: Number of rows/records, number of columns, etc.
Usage
Ez az adathalmaz ideális számos alkalmazáshoz:
Alkalmazás: Machine learning modellek fejlesztése és tesztelése a stressz, depresszió, szorongás vagy „at‑risk” hallgatók előrejelzésére GPA, tanulási és alvási szokások alapján. Alkalmazás: Oktatási analitika és dashboardok készítése a hallgatói jóllét, study–sleep balance és programonkénti terhelés vizsgálatára. Alkalmazás: Egyetemi kurzusok, data science/ML oktatás, statisztika és pszichológiai módszertan demonstrációja valósághű, de teljesen szintetikus adatokkal. Alkalmazás: Korai figyelmeztető rendszerek, ajánlómotorok és „what‑if” szimulációk prototípusainak építése valódi hallgatói adatok kezelése nélkül.
Alkalmazás: Machine learning modellek fejlesztése és tesztelése a stressz, depresszió, szorongás vagy „at‑risk” hallgatók előrejelzésére GPA, tanulási és alvási szokások alapján. Alkalmazás: Oktatási analitika és dashboardok készítése a hallgatói jóllét, study–sleep balance és programonkénti terhelés vizsgálatára. Alkalmazás: Egyetemi kurzusok, data science/ML oktatás, statisztika és pszichológiai módszertan demonstrációja valósághű, de teljesen szintetikus adatokkal. Alkalmazás: Korai figyelmeztető rendszerek, ajánlómotorok és „what‑if” szimulációk prototípusainak építése valódi hallgatói adatok kezelése nélkül.
- Application: Brief description of the first use case.
- Application: Add more as needed.
Coverage
Földrajzi lefedettség: Több régiót lefedő globális minta – Európa (pl. Hungary, UK, Germany), Észak‑Amerika (USA, Canada), Dél‑Amerika (Brazil), Ázsia (India, China), Afrika (South Africa), Óceánia (Australia).
Időtartomány: A survey_date értékek főként 2024–2026 közötti szintetikus felméréseket reprezentálnak, friss, modern egyetemi környezetet modellezve.
Demográfiai adatok: 18–30 év közötti hallgatók, 1–5. évfolyam, több gender kategória, különböző szakok (STEM, társadalomtudomány, bölcsészet, üzlet, egészségtudomány, művészet), változatos GPA, tanulási idő és stressz-szintek.
- Geographic Coverage: Region, country, or global.
- Time Range: Start date - End date of data collection.
- Demographics (if applicable): Age groups, gender, industries, etc.
License
Szabadalmazott, kereskedelmi célú, teljesen szintetikus adathalmaz. Belső kutatásra, oktatásra, analitikára és AI/ML fejlesztésre használható; a nyers teljes dataset továbbértékesítése vagy nyilvános megosztása licenc nélkül nem engedélyezett.
Who Can Use It
Adattudósok: Gépi tanulási modellek betanításához és benchmarkolásához diák‑jólléti, kockázatbecslési és szegmentációs feladatokon.
Kutatók: Akadémiai és alkalmazott kutatásokhoz az egyetemi stressz, tanulmányi teljesítmény és mentális egészség összefüggéseinek vizsgálatára, adatvédelmi kockázat nélkül.
Vállalkozások / intézmények: Egyetemek, edtech és wellbeing startupok, analitikai cégek, akik dashboardokat, támogató rendszereket és AI‑alapú hallgatói szolgáltatásokat terveznek valódi hallgatói adatok kezelése nélkül.
További megjegyzés: A dataset 100% szintetikus, nem tartalmaz PII-t, GDPR‑kompatibilis, ezért biztonságosan használható nyilvános demókban, oktatásban és felhőalapú környezetekben is.
- Data Scientists: For training machine learning models.
- Researchers: For academic or scientific studies.
- Businesses: For analysis, insights, or AI development.
Include any additional notes or context about the dataset that might be helpful for users.
Loading...
