实现网
开发工程师 远程兼职

项目需求书:图案边缘高清平滑重建智能体 1. 项目任务概述 1.1. 项目目标 开发一个针对低质量图像(如网络截图、低分辨率样稿)的高精度平滑重建模块。系统需接收图像文件并结合用户指定的“目标物理输出尺寸”,自动进行图像高倍率重建与去锯齿处理,确保输出图像精确映射底层物理输出设备的极小值公差,且实现色彩保真。 2. 项目需求 2.1. 核心图像处理功能 • 入参解析与动态重建倍率:接口接收光栅图像(如 JPG、PNG)及目标物理尺寸(宽×高)。系统需根据物理输出极限(0.03mm)动态计算重采样倍率,生成目标分辨率基准。 • 自适应平滑与去锯齿处理:在保持图像特征拓扑结构完整的前提下,系统需精准消除图像中的马赛克、JPEG 压缩伪影及几何边缘锯齿,实现边界的锐化拟合与平滑过渡。 • 色彩保真:处理需锁定原始图像色彩空间。不能在几何轮廓提取、平滑过渡区域或插值计算中产生异常色带、色彩溢出、光晕效应。特征色值(RGB/CMYK)最终不能色差 ΔE >1.0。 • 处理拦截与异常返回(阈值由开发方定义):开发团队需建立底层的图像质量评估模型。对于信息熵过低、特征点严重缺失、无法通过算法恢复基本轮廓的极端模糊图像,系统需并返回标准错误码以提示用户。 • 标准光栅图像输出:最终输出结果必须为无损或高质量的高分辨率光栅图像文件(如 PNG 或 TIFF),不接受矢量路径文件交付。 2.2. 核心量化技术指标(验收基准) • 物理映射精度(硬指标):系统输出的图像,在严格按照“目标物理输出尺寸”进行等比例映射时,其局部边缘锯齿或最小像素块的映射物理边长必须 ≤ 0.03 毫米(约等效于 846 DPI 的平滑分辨率)。 • 色彩保真度(Delta E 极限约束):在标准色彩空间下,处理前后的核心特征色块色差值需要输出, ΔE < 1.0。 3. 交付与验收要求 3.1.1. 验收用例 1:极端放大下的平滑度验证 • 操作:输入低分辨率(如 500×500 像素)图像,指定目标物理尺寸放大至 1000mm 宽度输出。 • 合格标准:输出图像的几何边缘与色块交界处必须呈现平滑的视觉效果,转换后核算像素块的物理映射尺寸 ≤ 0.03mm。 3.1.2. 验收用例 2:色彩一致性验证 • 操作:输入包含高饱和度及强对比度颜色(如纯红与纯蓝交界)的测试图案。 • 合格标准:提取处理前后的对应坐标色值进行比对,需要有色差的输出,ΔE < 1.0。颜色边界必须保持锐利分隔,不得出现插值计算导致的第三种渐变色或脏色。 3.1.3. 验收用例 3:鲁棒性与异常拦截验证 • 操作:输入带有高频噪点、严重块状伪影且低于质量评估下限的无效图像。 • 合格标准:系统依据内部设定的评估阈值准确触发拦截机制,返回标准错误日志,进程不发生崩溃或内存泄漏。 4. 技术限制 • 本项目不限制开发团队的技术路径(支持但不限于传统 CV 算法、轮廓拟合+重采样、轻量级 AI 超分模型等)。 • 最终评价标准完全以输出质量为准,即严格满足“物理映射边长 ≤ 0.03mm”与“核心色差 ΔE < 1.0”的双重硬性指标。

预估 3000 元

已有1人投递
全栈开发(后端 + AI Pipeline 为主) 远程兼职
LLM集成
AI Pipeline
Supabase
Next.js

一、需求描述 产品类别:SaaS / 物业科技(PropTech) 开发进度:已完成产品原型、UI 设计规范、数据库 Schema 草稿、完整需求文档及 AI 提取规则文档,需要技术开发实现。 核心功能: 从 PDF 财务报告中自动提取结构化数据(文件解析 pipeline) 基于 LLM 的数据 enrichment,将会计描述转化为用户可读的信息 多层数据写入与管理(Supabase 数据库 + Edge Functions) React 移动端前端展示,含多层信息分层、数据可视化及异常提示逻辑 技术栈: Next.js · TypeScript · Supabase · Claude API(或 OpenAI API) 二、职责边界 工程师负责:将规则转化为代码实现,保证 pipeline 跑通、数据准确、前端展示正确。 创始人负责提供:核心业务规则(数据提取规则、COA 分类逻辑、异常检测阈值、enrichment 规范),以完整文档形式交付。工程师无需自行设计业务逻辑。 三、第一阶段交付物(4–6 周) PDF 上传 → Claude API 提取 → Supabase 写入 Edge Function 执行 delta 计算及异常判断 基础前端展示可跑通(数据正确呈现) 提取准确率验证报告(用真实数据核对,量化错误率) 注:第一阶段使用脱敏示例数据开发,规则文档和架构设计完整,无需从零摸索。 四、参考产品 功能方向参考:Commonwealth Bank App、Xero(财务信息展示逻辑) 系统架构参考:标准 SaaS 管理后台 + 移动端信息展示页 五、人才要求 必须具备: 3 年以上全栈开发经验,有独立交付完整项目的经历 熟悉 Next.js、TypeScript、Supabase 有 LLM API(Claude / OpenAI)集成经验,或做过 PDF 解析、文档提取、prompt engineering 相关项目 能阅读英文技术文档(API 文档、官方文档) 理解 deterministic 逻辑与 LLM 逻辑的分工边界,能在两者之间做出正确判断 加分项: 有 SaaS、金融类或文档 AI 相关项目经验;做过 OCR、数据管道、RAG 或复杂业务规则系统。 六、合作方式 远程兼职,里程碑付款制(按阶段交付结算,非月薪) 日常沟通:微信,中文为主 工作语言:中文沟通 + 代码英文注释 七、预算 第一阶段分两步结算:Pipeline 部分(PDF提取→Supabase写入)参考 8,000–10,000 元,验收通过后继续前端展示部分。总预算根据经验和测试任务协商。 表现优秀者优先邀请参与后续阶段合作。 八、投递要求 请附 1–2 个最相关项目案例,说明负责模块,有无文档处理或 LLM 相关经验。 必答筛选题(请在投递时一并回答) 在你负责的项目中,哪些逻辑由 LLM 处理,哪些由代码处理,为什么这样分工?请用 3 句话说明。

预估 10000 元

已有8人投递
产品开发 远程全职

一、整体框架 / 语言 • C# + .NET (WPF):继续作为上位机 UI 和业务逻辑的主框架 • Python(子进程或服务):负责训练、复杂算法(如深度学习、PatchCore、复杂图像处理) • 通信方式:CLI + StdOut、TCP/Socket、或 gRPC/REST(WPF ↔ Python) --- 二、相机采集系统(工业相机 SDK 抽象) • 工业相机 SDK: • 海康:MVS / MVSDK(C/C++/C#),或 HikRobot 官方 .NET SDK • Basler:pylon SDK(有 .NET 组件) • 大恒:Galaxy SDK • C# 技术栈: • 抽象接口:ICamera, ICameraControl(采集 / 触发 / 参数读写) • Task/async 模式 + 生产者/消费者队列(采集线程与处理线程解耦) • 图像格式:System.Drawing.Bitmap 或 WriteableBitmap / System.Windows.Media.Imaging 统一封装 • 图像基础处理(非 AI): • OpenCvSharp4(C# 封装的 OpenCV,用于预处理、ROI 裁剪、格式转换) --- 三、开源标注软件集成(如 X-AnyLabeling / LabelMe) • 外部工具集成: • System.Diagnostics.Process 启动外部标注软件,带图片目录参数 • 通过配置保存标注软件路径、数据目录 • 标注数据格式: • LabelMe JSON / COCO JSON / YOLO txt 等 • C# 反序列化:System.Text.Json 或 Newtonsoft.Json • 数据转换模块: • AnnotationConverter:将推理结果(框、标签、置信度)↔ 标注 JSON • 目录结构约定:dataset/images, dataset/labels 等 • 训练触发(闭环): • 从 WPF 调 Python 脚本:ProcessStartInfo 调用 python train.py ... • 进度回调:Python 通过 stdout 输出或通过 TCP/Socket 返回给 WPF --- 四、AI 拍摄 / 光学自动对焦(Auto Exposure / Auto Focus) 1. 图像评价算法(清晰度/亮度/对比度) • C#: • OpenCvSharp 实现:Laplacian 方差(清晰度)、直方图 / 均值(亮度)、对比度等 • Python 备选(如后续要用更复杂评价指标): • OpenCV (cv2) + NumPy 2. 参数搜索 / 优化算法 • 简易爬山算法 / 网格搜索 / 模拟退火: • C# 自己实现即可(算法很轻量) • 对接相机 SDK 参数: • 曝光、增益、gamma、光圈、焦距(若镜头可控) 3. 硬件控制 • 使用各家 SDK 中的: • SetExposureTime, SetGain, SetFocus, SetAperture 等属性 • 统一封装到 ICameraControl.AutoOptimizeAsync() 中,隐藏厂商差异 六、通讯系统 / 工业互联(PLC / MES 等) • 工业协议库(C#): • NModbus4:Modbus TCP/RTU • S7.Net:西门子 S7 PLC • 若有自定义 TCP 协议:System.Net.Sockets • 架构设计: • ICommunicationProvider / IIndustrialProtocol 抽象接口 • 插件化实现:ModbusProvider, S7Provider, TcpJsonProvider 等 • 抽象触发源与结果输出: • ITriggerSource(软触发 / PLC 位变化触发) • IResultOutput(写寄存器、发 JSON、写文件等)

Small 962b3490f5109ef806411c5392290867
昵称登录后显示 5 个月前发布

预估 700元 / 8小时

已有4人投递

我是技术人才
我在寻找远程工作

技术人才入驻

我是创业者
我在寻找技术人才

发布用人需求