JAVA同步第三方数据库数据到自有数据库

m0_48665929 2020-06-22 03:39:40
JAVA实现定时任务接口,定时按时间增量去同步第三方系统的数据,第三方接口有数据量限制(1000),请问在某次调用第三方接口时获取到了1000条记录,在存储到自有数据库时,比如第200条记录出现异常存储失败,这时候你们是怎么处理的呀?请各位指点指点!
...全文
4590 5 打赏 收藏 转发到动态 举报
AI 作业
写回复
用AI写文章
5 条回复
切换为时间正序
请发表友善的回复…
发表回复
冰思雨 2020-06-24
  • 打赏
  • 举报
回复
一般情况下是批量读取,然后,逐条处理。 如果某条记录在处理的时候出现异常,通常的做法是将错误信息保存下来(数据库或者写硬盘日志)。 错误信息尽量完整,也就是说,关键的上下文数据,最好是同时保存下来,当然,也包括异常信息。 这样有助于排查问题。 之后,编写一个针对错误信息的处理程序,针对各种异常情况进行错误信息的处理,逐渐修复和完善程序。 重试机制,一般情况下,并不能容错所有的异常情况,并且,要设定最大重试次数。
s478853630 2020-06-23
  • 打赏
  • 举报
回复
假如3000条数据,批处理1000,分3批,第一批没问题其余报错,有三种常见错误: 1,主键冲突数据重复,解决方案:把数据分成两波,一波insert,一波update 2,数据类型不匹配,解决方案:做好数据类型转换,字符串/日期时间/整型/浮点型四种类型足矣 3,字段长度不够,解决方案:根据异常信息找到相应字段,执行alter table xxx change ....语句 我们自主研发的ETL遇到这三种情况由程序自动解决,不用人工干预,并且有网页版操作界面 如果出现第四种情况,就发邮件预警
咦哟~~~ 2020-06-23
  • 打赏
  • 举报
回复
那你定义一个机制呗 错误几次后 存到异常表中
m0_48665929 2020-06-23
  • 打赏
  • 举报
回复
引用 1 楼 青海棠的回复:
批量存储,加事务,报错回滚,重试
重试还是失败怎么办?不能一直重试吧。
沁海棠 2020-06-22
  • 打赏
  • 举报
回复
批量存储,加事务,报错回滚,重试
一、用户与企业管理模块 求职者管理 多端注册登录:支持 Web、移动端注册,集成第三方账号(微信、支付宝)快捷登录,实现身份认证与简历真实性核验 个人中心:维护基本信息(学历、专业、工作经验)、求职意向(期望岗位、薪资、地点)、技能标签(Java、项目管理等),支持简历 PDF 上传与在线编辑 求职行为记录:自动追踪岗位浏览、投递、收藏、沟通记录,生成个人求职动态 timeline 企业管理 企业入驻与认证:企业注册需提交营业执照、法人信息,审核通过后开通招聘权限,支持企业信息展示(规模、行业、福利) 招聘管理后台:发布 / 编辑岗位(职责、要求、薪资范围)、管理简历库(筛选、标记、回复)、查看招聘数据报表(投递量、匹配度) 招聘效果分析:展示岗位曝光率、简历转化率、候选人质量评分,辅助优化招聘策略 二、岗位数据采集与处理模块 多源数据采集 自有平台数据:企业直接发布的岗位信息、求职者主动填写的简历数据 外部数据对接:通过 API 接口对接主流招聘平台(智联、前程无忧)、高校就业网、人才市场数据 爬虫补充采集:针对垂直领域岗位(如 IT、设计)定向爬取行业网站数据,确保岗位覆盖广度 实时数据更新:设置定时任务(每小时)同步最新岗位,标记过期岗位(如已招满) 数据预处理与标准化 清洗与去重:处理重复岗位、虚假招聘信息,过滤无效简历(如信息缺失率 > 50%) 标准化处理: 岗位分类:映射至统一职业分类标准(如国家职业大典) 技能归一化:将 "Java 开发"、"Java 工程师" 合并为 "Java" 技能标签 薪资格式化:统一薪资单位(如 "15k-20k / 月" 标准化为数值范围) 特征提取: 从岗位描述中提取核心要求(如 "3 年经验"、"本科及以上") 从简历文本中提取项目经验、技能熟练度(如 "Python 熟练") 三、大数据存储与计算模块 分层存储架构

67,543

社区成员

发帖
与我相关
我的任务
社区描述
J2EE只是Java企业应用。我们需要一个跨J2SE/WEB/EJB的微容器,保护我们的业务核心组件(中间件),以延续它的生命力,而不是依赖J2SE/J2EE版本。
社区管理员
  • Java EE
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧