Jaidev:
(i) 机器学习的可解释性——我们通常使用机器学习来自动化流程,但它也可用于解释数据。必须关注模型解释数据的效果。我们几乎淹没在黑盒模型中,这意味着我们完成了一些事情,但大多数情况下我们错过了更大的图景和数据中隐藏的真相。
(ii) 更好的工具——学术研究进展的 加拿大手机号码数据库 速度与行业采用该研究的速度之间存在巨大差距。弥合这一差距的一种方法是找到更好的方法来确定某项技术是否具有长期可行性。实际上,数据科学还没有普及到普通人能够从中获益的程度。所有这些问题都将从更好、更易于使用的工具中受益匪浅。
(iii) 认知度— 不幸的是,数据科学的炒作达到了前所未有的高度,我们不知道它是否已经达到顶峰。这导致消费者、从业者和学生都对数据科学抱有极不切实际的期望。它不是灵丹妙药。它不是一劳永逸的解决方案。作为一个社区,我们必须尽一切努力消除误解。
对有志于成为数据科学家的人的建议
您认为数据分析师和数据科学家需要具备哪些最重要的技能,包括技术和软技能?
Jaidev: 如果你是编程新手,可以学习 Python、R 或 MATLAB 中的一种。通常学习第一种编程语言很难,但从一种语言转到另一种语言就容易多了。掌握概率、统计和线性代数的知识是很好的——只要它们适用于机器学习。无论你学习哪种概念,都要确保你能编写相应的代码。至于软技能,要善于沟通——多读书,多处理大量数据,并谈论或写下从这些数据中得出的见解。
有志于从事数据工作的人士应该在处理混乱、嘈杂的数据时投入多少精力?他们还必须在哪些领域积累专业知识?
Jaidev: 尽可能多。没有人会把干净的数据集丢到你口袋里。数据科学家不仅要精通分析,还要精通 ETL 流程,这并不是什么新鲜事。做一名优秀的黑客。优秀的黑客是任何不怕用多种技术堆栈、数据源和算法弄脏双手的人。这通常会让人感到不舒服,但这正是突破发生的地方。
您对新手、数据科学学生或想要在数据分析行业建立职业生涯的从业者有什么建议?
无论是基于行业还是基于技术领域,数据科学面临的三大问题是什么?
-
tanjimajha12
- Posts: 194
- Joined: Mon Dec 23, 2024 4:56 am