2023. 6. 14. 09:04ㆍ학습
https://www.kaggle.com/competitions/icr-identify-age-related-conditions
Goal of the Competition
The goal of this competition is to predict if a person has any of three medical conditions. You are being asked to predict if the person has one or more of any of the three medical conditions (Class 1), or none of the three medical conditions (Class 0). You will create a model trained on measurements of health characteristics.
To determine if someone has these medical conditions requires a long and intrusive process to collect information from patients. With predictive models, we can shorten this process and keep patient details private by collecting key characteristics relative to the conditions, then encoding these characteristics.
Your work will help researchers discover the relationship between measurements of certain characteristics and potential patient conditions.
Context
They say age is just a number but a whole host of health issues come with aging. From heart disease and dementia to hearing loss and arthritis, aging is a risk factor for numerous diseases and complications. The growing field of bioinformatics includes research into interventions that can help slow and reverse biological aging and prevent major age-related ailments. Data science could have a role to play in developing new methods to solve problems with diverse data, even if the number of samples is small.
Currently, models like XGBoost and random forest are used to predict medical conditions yet the models' performance is not good enough. Dealing with critical problems where lives are on the line, models need to make correct predictions reliably and consistently between different cases.
Founded in 2015, competition host InVitro Cell Research, LLC (ICR) is a privately funded company focused on regenerative and preventive personalized medicine. Their offices and labs in the greater New York City area offer state-of-the-art research space. InVitro Cell Research's Scientists are what set them apart, helping guide and defining their mission of researching how to repair aging people fast.
In this competition, you’ll work with measurements of health characteristic data to solve critical problems in bioinformatics. Based on minimal training, you’ll create a model to predict if a person has any of three medical conditions, with an aim to improve on existing methods.
You could help advance the growing field of bioinformatics and explore new methods to solve complex problems with diverse data.
대회 목표
이 대회의 목표는 세 가지 질병 중 어떤 질병이 있는지 예측하는 것입니다. 참가자가 세 가지 질병 중 하나 이상을 가지고 있는지(Class 1), 아니면 세 가지 질병 중 하나도 가지고 있지 않은지(Class 2)를 예측하라는 요청을 받습니다. 건강 특성 측정을 통해 학습된 모델을 생성합니다.
이러한 질환이 있는지 확인하려면 환자로부터 정보를 수집하는 과정이 길고 번거롭습니다. 예측 모델을 사용하면 질환과 관련된 주요 특성을 수집한 다음 이러한 특성을 인코딩하여 이 과정을 단축하고 환자 세부 정보를 비공개로 유지할 수 있습니다.
여러분의 작업은 연구자들이 특정 특성의 측정값과 잠재적인 환자 상태 사이의 관계를 발견하는 데 도움이 될 것입니다.
컨텍스트
나이는 숫자에 불과하다는 말이 있지만, 노화와 함께 다양한 건강 문제가 발생합니다. 심장병과 치매부터 청력 상실과 관절염에 이르기까지, 노화는 수많은 질병과 합병증의 위험 요소입니다. 생물정보학 분야는 생물학적 노화를 늦추거나 되돌리고 주요 노화 관련 질병을 예방하는 데 도움이 될 수 있는 개입에 대한 연구를 포함하여 성장하고 있습니다. 데이터 과학은 샘플 수가 적더라도 다양한 데이터로 문제를 해결할 수 있는 새로운 방법을 개발하는 데 중요한 역할을 할 수 있습니다.
현재 건강 상태를 예측하기 위해 XGBoost나 랜덤 포레스트와 같은 모델이 사용되고 있지만, 모델의 성능이 충분하지 않습니다. 생명이 달린 중대한 문제를 다루기 위해서는 모델이 다양한 사례에 대해 안정적이고 일관되게 정확한 예측을 내릴 수 있어야 합니다.
2015년에 설립된 대회 주최사인 인비트로 셀 리서치(InVitro Cell Research, LLC, 이하 ICR)는 재생 및 예방적 맞춤 의학에 중점을 둔 민간 투자 회사입니다. 뉴욕시 지역에 위치한 사무실과 연구소는 최첨단 연구 공간을 제공합니다. 인비트로 셀 리서치의 과학자들은 노화된 사람들을 빠르게 회복시키는 방법을 연구하는 이 회사의 사명을 정의하고 안내하는 데 도움을 줍니다.
이 대회에서 여러분은 건강 특성 데이터를 측정하여 생물정보학의 중요한 문제를 해결하게 됩니다. 최소한의 교육을 바탕으로 기존 방법을 개선하기 위해 세 가지 질병 중 하나에 걸렸는지 예측하는 모델을 만들어야 합니다.
성장하는 생물정보학 분야를 발전시키고 다양한 데이터로 복잡한 문제를 해결하는 새로운 방법을 모색하는 데 도움을 줄 수 있습니다.
'학습' 카테고리의 다른 글
하둡 3일차 복습 (0) | 2023.08.10 |
---|---|
hadoop_hive 1일차 복습 (0) | 2023.08.07 |
KPI(Key Performance Indicator)와 KQI(Key Quality Indicator) : 공통점과 차이점 (0) | 2023.05.20 |
알고리즘 -1 풀하우스 (0) | 2023.05.18 |
파이썬 함수 정의: 반환 타입 지정하기 (def function() -> type :) (0) | 2023.05.18 |