اساس علم داده یا دیتا ساینس (Data Science) متشکل از نظریهها و مباحث مرتبط با چند رشتهٔ علمی مختلف است. در آن، با استفاده از روشهای علمی، الگوریتمها، فرایندها و سامانههای مختلف سعی میشود تا از دادههای ذخیرهشدهٔ سازمانها و مؤسسهها به مقاصد مختلف بهرهبرداری بشود. دانشمند داده باید در زمینهها مختلفی مهارت داشته باشد که مهمترین آنها مفاهیم آماری، علوم کامپیوتری و دانش مرتبط با دنیای کسبوکار است. کار اصلی دانشمند داده تجزیهوتحلیل دادههایی است که در بانکهای اطلاعاتی سازمانها و مؤسسهها ذخیرهسازی شدهاند. دادههایی که از اینترنت، گوشیهای هوشمند، مشتریها و … گردآوری شدهاند.