Ang data na pangkategorya ay impormasyon lang na pinagsama-sama sa mga grupo sa halip na nasa mga numeric na format, gaya ng Kasarian, Kasarian o Antas ng Edukasyon. Ang mga ito ay nasa halos lahat ng totoong buhay na mga dataset, ngunit ang mga kasalukuyang algorithm ay nahihirapan pa ring harapin ang mga ito. Kunin, halimbawa, ang XGBoost o karamihan sa mga modelo ng SKlearn.
Ano ang tumutukoy sa kategoryang data?
Ang
Categorical data ay ang statistical na uri ng data na binubuo ng mga kategoryang variable o ng data na na-convert sa form na iyon, halimbawa bilang pinagsama-samang data.
Ano ang categorical data at numerical data?
Numerical data ay ginagamit upang mangahulugan ng anumang kinakatawan ng mga numero (floating point o integer). Pangkategoryang data sa pangkalahatan ay ay nangangahulugang lahat ng iba pa at lalo na ang discrete na may label na mga grupo ang madalas na tinatawag.
Ano ang categorical data at tuluy-tuloy na data?
Mga kategoryang variable naglalaman ng limitadong bilang ng mga kategorya o natatanging pangkat … Ang mga tuluy-tuloy na variable ay mga numeric na variable na may walang katapusang bilang ng mga value sa pagitan ng alinmang dalawang value. Ang tuluy-tuloy na variable ay maaaring numeric o petsa/oras. Halimbawa, ang haba ng isang bahagi o ang petsa at oras na natanggap ang isang bayad.
Ano ang isang halimbawa ng pangkategoryang data?
Ang mga kategoryang variable ay kumakatawan sa mga uri ng data na maaaring hatiin sa mga pangkat. Ang mga halimbawa ng mga variable na kategorya ay lahi, kasarian, pangkat ng edad, at antas ng edukasyon. … Mayroong 8 iba't ibang kategorya ng kaganapan, na may timbang na ibinigay bilang numeric data.