Opendatabay APP

University Students Synthetic Mental Health Dataset – 10,000 Records

Synthetic Data Generation

Tags and Keywords

University

Students

Mental

Health

Synthetic

Data

Student

Wellbeing

Stress

Depression

Anxiety

Academic

Performance

Gpa

Study

Habits

Sleep

Patterns

Survey

Education

Analytics

Risk

Prediction

Machine

Learning

Training

Trusted By
Trusted by company1Trusted by company2Trusted by company3
University Students Synthetic Mental Health Dataset – 10,000 Records Dataset on Opendatabay data marketplace

"No reviews yet"

£79

About

This dataset contains 10,000 fully synthetic records describing university students’ demographics, academic performance, self‑reported mental health, stress factors, and lifestyle patterns. It is designed for safe research, analytics, and machine learning experiments on student wellbeing, without using any real student or medical data.

Dataset Features

id: Synthetic unique identifier for each student. country: Student’s (synthetic) country (e.g. Hungary, UK, USA, Canada, Germany, Australia, India, China, South Africa, Brazil). university: Synthetic university name (no real institution). year: Academic year of study from 1 to 5. gender: Gender category (Male, Female, Non-binary, Other). program: Field of study (STEM, Social Sciences, Humanities, Business, Health Sciences, Arts, etc.). age: Synthetic age in years, typically between 18 and 30. family_history_mental: 0/1 flag indicating whether there is a family history of mental illness. CGPA_0_4: Cumulative grade point average on a 0–4 scale. stress_0_5: Self‑reported overall stress level from 0 to 5. depression_0_5: Self‑reported depression severity (0–5). anxiety_0_5: Self‑reported anxiety severity (0–5) financial_stress_0_5: Financial stress score (0–5). academic_pressure_0_5: Academic pressure / workload stress score (0–5). weekly_study_hours: Number of hours studied per week. daily_sleep_hours: Average daily sleep hours. survey_date: Synthetic survey date between 2024 and 2026.
  • Column 1 Name: Description of what this column represents.
  • Column 2 Name: Add as needed...

Distribution

Data format: CSV (comma‑separated values) with a single flat table and header row. Adatmennyiség: 10,000 rows and 17 columns in the full dataset; a separate 20‑row jittered CSV sample is provided for public preview. Szerkezet: Each row corresponds to one synthetic university student, combining demographics, academic variables, mental health scores, stress drivers, and lifestyle indicators into one analysis‑ready table.
  • Data Volume: Number of rows/records, number of columns, etc.

Usage

Ez az adathalmaz ideális számos alkalmazáshoz:
Alkalmazás: Machine learning modellek fejlesztése és tesztelése a stressz, depresszió, szorongás vagy „at‑risk” hallgatók előrejelzésére GPA, tanulási és alvási szokások alapján. Alkalmazás: Oktatási analitika és dashboardok készítése a hallgatói jóllét, study–sleep balance és programonkénti terhelés vizsgálatára. Alkalmazás: Egyetemi kurzusok, data science/ML oktatás, statisztika és pszichológiai módszertan demonstrációja valósághű, de teljesen szintetikus adatokkal. Alkalmazás: Korai figyelmeztető rendszerek, ajánlómotorok és „what‑if” szimulációk prototípusainak építése valódi hallgatói adatok kezelése nélkül.
  • Application: Brief description of the first use case.
  • Application: Add more as needed.

Coverage

Földrajzi lefedettség: Több régiót lefedő globális minta – Európa (pl. Hungary, UK, Germany), Észak‑Amerika (USA, Canada), Dél‑Amerika (Brazil), Ázsia (India, China), Afrika (South Africa), Óceánia (Australia). Időtartomány: A survey_date értékek főként 2024–2026 közötti szintetikus felméréseket reprezentálnak, friss, modern egyetemi környezetet modellezve. Demográfiai adatok: 18–30 év közötti hallgatók, 1–5. évfolyam, több gender kategória, különböző szakok (STEM, társadalomtudomány, bölcsészet, üzlet, egészségtudomány, művészet), változatos GPA, tanulási idő és stressz-szintek.
  • Geographic Coverage: Region, country, or global.
  • Time Range: Start date - End date of data collection.
  • Demographics (if applicable): Age groups, gender, industries, etc.

License

Szabadalmazott, kereskedelmi célú, teljesen szintetikus adathalmaz. Belső kutatásra, oktatásra, analitikára és AI/ML fejlesztésre használható; a nyers teljes dataset továbbértékesítése vagy nyilvános megosztása licenc nélkül nem engedélyezett.

Who Can Use It

Adattudósok: Gépi tanulási modellek betanításához és benchmarkolásához diák‑jólléti, kockázatbecslési és szegmentációs feladatokon. Kutatók: Akadémiai és alkalmazott kutatásokhoz az egyetemi stressz, tanulmányi teljesítmény és mentális egészség összefüggéseinek vizsgálatára, adatvédelmi kockázat nélkül. Vállalkozások / intézmények: Egyetemek, edtech és wellbeing startupok, analitikai cégek, akik dashboardokat, támogató rendszereket és AI‑alapú hallgatói szolgáltatásokat terveznek valódi hallgatói adatok kezelése nélkül. További megjegyzés: A dataset 100% szintetikus, nem tartalmaz PII-t, GDPR‑kompatibilis, ezért biztonságosan használható nyilvános demókban, oktatásban és felhőalapú környezetekben is.
  • Data Scientists: For training machine learning models.
  • Researchers: For academic or scientific studies.
  • Businesses: For analysis, insights, or AI development.

Include any additional notes or context about the dataset that might be helpful for users.

Listing Stats

VIEWS

2

DOWNLOADS

0

LISTED

02/12/2025

REGION

GLOBAL

Universal Data Quality Score Logo UDQSQUALITY

5 / 5

VERSION

1.0

Loading...

£79

Download Dataset in CSV Format