-
-
- 易聘网人才简历
- 简历编号:EPINP0E451472866
-
求职意向 举报-
- 应聘职位:算法工程师 自然语言处理(NLP) 图像算法工程师 算法工程师
- 期望薪资: 15000-19999元
- 期望地区: 上海
- 期望行业: 计算机软件
自我介绍-
1.掌握python语言 2.掌握线性回归、逻辑回归、SVM、决策树、贝叶斯等经典机器学习算法; 3.掌握深度学习DNN、CNN、RNN、LSTM有关算法; 4.熟练掌握sklearn机器学习及TensorFlow深度学习框架的使用; 5.熟练掌握 seq2seq、word2vec,attention 机制等 6.熟悉 transformer,elmo,bert 等预处理模型;. 英语(良好) Python(精通)
工作经验:- 上海苍苔信息科技有限公司
- 算法工程师
- 工作描述:
2019-11至2020-02——公司:上海苍苔信息科技有限公司(150-500人) 行业:互联网/电子商务 性质:民营公司 部门: 支持部门 职位: 算法工程师 工作描述:广告投放平台创意生成,给广告主投放广告图片换背景 2018-04至2019-09——公司:合肥薪火信息科技有限公司(50-150人) 行业:计算机软件 性质:民营公司 部门: 技术部 职位: 算法工程师 工作描述:1.使用 tensorflow 开发智能客服,包括闲聊机器人和业务机器人 2.通过对大量专业文档和资料的编码及实体标注(OIBES),对各车辆名称,配件信息,相关参数等关键词进行提取 3.针对来自于新闻网站的30000篇文章,其主题包括旅游、体育、政治、娱乐等12个不同主题,构建模型分析不同类型文章之间的特征,实现对一篇新文章的自动分类 4. 利用原始图片等相关标注数据,依靠深度学习,卷积神经网络,监测图像是否包含相关标注的物品以及输出对应的坐标位置,完成定位与筛查功能类
项目经验-
2019-11至2020-02——广告投放平台创意生成 所属公司:上海苍苔信息科技有限公司 项目描述:广告投放平台创意生成,给广告主投放广告图片换背景 1.使用的训练数据集为CoCo数据集,图片共计80个小类,12个超类 2. 使用mask_rcnn模型训练得到目标实体的多边形mask(掩码) 3. 将原图片及mask对照背景图进行padding,padding值均为0 4. 将掩码,原图片,背景图片进行融合将图片换背景( 原图*mask+背景图*(1-mask)) 2019-05至2019-09——智能客服开发 所属公司:合肥薪火信息科技有限公司 项目描述:开发智能客服,包括闲聊机器人和业务机器人。 闲聊机器人构建: 数据获取:获取网上公开的对话数据集,将原始数据集转换为 ask 和 answer 的键值对形式,使用 sqlite3 将其保存到 sql 数据库中; 数据预处理:根据问答对的长度,将数据库中的数据分为 4 份,有利于使用 static_rnn 构建网络; 网络构建:采用embedding+512个隐藏神经元的三层BasicLSTMcell+static_rnn+seq2seq +Attention模型, 批次尺寸为 100,计算下采样损失,采用动态学习率+Adam 优化器更新参数; 模型评估及优化:采用 bleu 评估模型效果,Albert 替换 embedding 做字向量获取,梯度截断防止梯度爆炸; 检索机器人构建: 数据获取及清洗:获取蚂蚁金服语义相似度比赛提供的数据集,形式为:[id,text1,text2,label],共 102477 条, 抽选其中 4000 条,得到正确的回答结果; 数据预处理:保存 2000 条正确的问答对,word2vec 训练文本的字向量并保存,获取 word2id 字典保存,将 所有数据用 word2id 转变成 id,padding 填充至固定长度 256,再用转换成文本向量; 网络构建和训练:先训练文本相似度度量模型,在训练问答系统;过程:将文本向量送入 BasicLSTMcell+双向 动态 rnn+FC 得到高阶文本向量,计算 text1 和 text2 余弦相似度,采用交叉熵损失函数,Adam 优化器,批次尺寸64训练,得到文本相似度度量模型保存,将 2000 条问答对中的提问通过度量模型转换为高阶文本向量并 保存;输入客户问题,通过文本相似度度量模型转换为高阶向量,逐一计算客户问题向量和 2000 条提问的相似 度,返回高于阈值 0.85 的最高相似度的问答对结果; 模型评估及优化:使用准确率评估问答结果,增大批次尺寸,增加问答对数量; 闲聊机器人经过调参和1000多个轮次的训练,BLEU 达到 0.73左右;检索机器人准确率0.75左右 2018-10至2019-03——基于NLP车辆专有名词命名实体识别 所属公司:合肥薪火信息科技有限公司 项目描述:通过对大量专业文档和资料的编码及实体标注(OIBES),对各车辆名称,配件信息,相关参数等关键词进行提取 1.文本数据预处理和清洗,制作数据集 2.对文本进行jieba分词,并把分词信息embedding到其中 3.利用tensorflow深度学习框架构建BiLSTM-CRF和IDCNN-CRF两种算法模型进行训练 4.利用viterbi算法对模型预测结果进行解码 5.通过模型的比较学习,认为基于cnn的模型效果较好但因复杂训练较慢,最终使得预测F1值达到0.75的成绩 2018-02至2018-06——新闻主题文章文本分类 所属公司:合肥薪火信息科技有限公司 项目描述:针对来自于汽车网站的30000篇文章,构建模型分析不同类型文章之间的特征,实现对一篇新文章的自动分类。 1.使用LabelEncoder编码实现文章类别标签化 2.通过jieba对每篇文章进行分词处理,并去除停用词 3.使用TfidfVectorizer计算文章TF-IDF词袋模型、对所有文章构建word2vec模型; 4.分别对TF-IDF词袋模型、word2vec词向量模型构建模型分析; 5.模型评估:混淆矩阵、精确率、召回率、f1参数分析 2017-07至2017-12——目标定位 所属公司:合肥薪火信息科技有限公司 项目描述:基于卷积神经网络的目标检测项目,主要是检测获取到的图像中所包含物体的种类和位置,用于后续项目的分析应用。 1.完成图像标注,数据预处理; 2.在TensorFlow中构建SSD模型: 基于VGG16的模型提取38*38特征图,再利用相关的卷积神经网络与池化技术,完成19*19、10*10、5*5、3*3、1*1等相关特征图的模型 在不同的大小的特征图中完成不同的先验框设计,各个特征图像先验框个数依次为4、6、6、6、4、4,最终完成8732个先验框坐标的确定 完成先验框相对于原图的编码、解码函数 利用先验框与真实的标签坐标进行IOU交并比值验证,通过阈值完成样本与先验框的匹配 类别损失和位置损失共同构成损失函数; 3.根据损失函数训练模型,得到实现目标定位的模型;
学历教育- 安徽建筑大学
- 热能与动力工程
- 教育经历:
2013-09至2017-06——安徽建筑大学 热能与动力工程 本科 传统能源的利用及新能源的开发,和如何更高效的利用能源。
获得证书-
2016-12——大学英语四级:438
培训经历 -
-
- 相似的简历



关注微信
消息提醒
在线客服