作者 | MirzaZhao
编辑 | NewBeeNLP
面试锦囊之面经分享系列,持续更新中
后台回复『面试』加入讨论组交流噢
211菜硕,手里2篇水文。听说之前算法很卷,头铁一次试试。
阿里
一面
没打招呼突击电话面试(30min)
- 地点ok?时间ok?(base杭州,暑期,全部ok ok ok)简单自我介绍一下,项目经历选一个说说?
- 项目中对于没有标签的数据,怎么处理,还有什么别的方法?(我用的远程监督,别的还有one-shot zero-shot label embedding)
- 假设一个情景题,微博创立初期,短文本,10w数据集,无监督,分类怎么做(我答的用label embedding做或者用embedding+聚类kmeans)
- embedding怎么实现?(fasttext or word2vec,不能用BERT,数据量大不合适)补充:你说的是词向量,句子向量怎么做呢(+average pooling最常用,还有别的方法没列举)