分析http协议头,关于boundary

recnad 2011-03-28 05:00:25
上传文件时,协议头里有个boundary 是随机生成的字符串,用来分隔文本的开始和结束, 如果依照这个字符串来判断文本内容的开始结束,文本内部如果正好有相同的字符串怎么办?
...全文
10012 16 打赏 收藏 转发到动态 举报
写回复
用AI写文章
16 条回复
切换为时间正序
请发表友善的回复…
发表回复
辰岡墨竹 2012-07-12
  • 打赏
  • 举报
回复
一般来说用一个生成一个UUID的话,会可靠很多。而且一般来说上传文件最好用BASE64进行编码,你只要用BASE64不用的符号就可以保证不冲突了。尤其是上传二进制文件时,其中很可能有\r、\n之类的控制字符,有时还可能出现最高位被错误处理的问题,所以必须进行编码。
ssyyzzxx 2012-07-12
  • 打赏
  • 举报
回复
反正他这么规定,你服务端就这么区分就行了
至于有可能出现冲突的问题,那是客户端的事儿
有可能客户端在生成那个值的时候,就检测过内容中是否有相同的数据,如果有相同的,就换一个字符串
recnad 2011-04-11
  • 打赏
  • 举报
回复
[Quote=引用 10 楼 ok1234567 的回复:]

boundary 在数据体中常常并不只出现一对,boundary同时还可以嵌套
length域信息通常是在定界后解析,也不保证总是有该域信息,文本中非常可能含有length冲突信息
数据打包者要确保其唯一可识别,不能有冲突,冲突就意味着接收方可能解析错误
确保其唯一无冲突,应该不算难事吧:)
[/Quote]
关键我如果解析这些接收的数据的时候,能不能就根据boundary来判断开始结束呢?如果生成的boundary可能会冲突,那我解析的时候还得做一些额外的工作来保证数据的完整性。
Sou2012 2011-04-11
  • 打赏
  • 举报
回复
smwhotjay 2011-04-11
  • 打赏
  • 举报
回复
http是\r\n\r\n通用的结束
ok1234567 2011-03-30
  • 打赏
  • 举报
回复
boundary 在数据体中常常并不只出现一对,boundary同时还可以嵌套
length域信息通常是在定界后解析,也不保证总是有该域信息,文本中非常可能含有length冲突信息
数据打包者要确保其唯一可识别,不能有冲突,冲突就意味着接收方可能解析错误
确保其唯一无冲突,应该不算难事吧:)
covsno 2011-03-29
  • 打赏
  • 举报
回复
boundary的生成由客户端负责保证唯一性和正确性

客户端可以使用GUID嘛
recnad 2011-03-29
  • 打赏
  • 举报
回复
[Quote=引用 5 楼 hpf976149 的回复:]

在数据中增加数据长度信息,先得到数据长度,再解析数据
[/Quote]
一般来说,的确都有个length信息,但是我见人说可能有的时候没有length,那么服务器这个时候到底怎么判断结束呢? 我觉得单纯用boundary来判断很不严谨,不能保证数据100%的正确,但是实际应用中的确没有听说谁上传的文件保存没有成功的,要么就是当出现第一次boundary的时候作为开始,出现最后一次boundary的时候作为结束,不过这样代码的实现就稍微复杂一点。
recnad 2011-03-29
  • 打赏
  • 举报
回复
[Quote=引用 2 楼 flandy_feng 的回复:]

boundary 时候有\r\n的吧,这是协议里面规定的啊;而自己使用的不会用到\r\n;http协议中\r\n\r\n表示http头已经结束了。
[/Quote]
\r\n不就是回车+换行? 你编辑文本的时候敲下回车就产生这两个字符了,怎么可能不会出现在文本中呢?
jwybobo2007 2011-03-28
  • 打赏
  • 举报
回复
去参考MIME规范

这个是MIME数据,本身和http头没关系
CppCoder 2011-03-28
  • 打赏
  • 举报
回复
在数据中增加数据长度信息,先得到数据长度,再解析数据
ok1234567 2011-03-28
  • 打赏
  • 举报
回复
安全的做法还是要有判断检测的,如果ASCII码文件中刚好存在与--boundary\r\n完全一致的情形,就会冲突
正常的做法应该是写一个函数,产生boundary,其中包含冲突检测,除非内容决不可能冲突,比如邮件实体使用了安全编码 :base64...
见习学术士 2011-03-28
  • 打赏
  • 举报
回复
后面跟着两个回车换行
flandy_feng 2011-03-28
  • 打赏
  • 举报
回复
boundary 时候有\r\n的吧,这是协议里面规定的啊;而自己使用的不会用到\r\n;http协议中\r\n\r\n表示http头已经结束了。
ArcRain 2011-03-28
  • 打赏
  • 举报
回复
这个随机字符串可以自定义的,一般不太会出现这种问题。
用 Java 编写的、协议和平台都独立的服务器端组件,使用请求/响应的模式,提供了一个基于 Java 的服务器解决方案。本文将从文件传输的基本原理入手,分析如何用 java进行文件的上传,并提出解决方案。 一、基本原理 通过 HTML 上载文件的基本流程如下图所示。浏览器端提供了供用户选择提交内容的界面(通常是一个表单),在用户提交请求后,将文件数据和其他表单信息编码并上传至服务器端,服务器端(通常是一个 cgi 程序)将上传的内容进行解 码了,提取出 HTML 表单中的信息,将文件数据存入磁盘或数据库。 -------------------------------------------------------------------------------- 回页首 二、各过程详解 A)填写表单并提交 通过表单提交数据的方法有两种,一种是 GET 方法,另一种是 POST 方法,前者通常用于提交少量的数据,而在上传文件或大量数据时,应该选用 POST 方法。在 HTML 代码中,在 <form> 标签中添加以下代码可以页面上显示一个选择文件的控件。 <input type="file" name="file01"> 在页面中显示如下(可能随浏览器不同而不同) 可以直接在文本框中输入文件名,也可以点击按钮后弹出供用户选择文件的对话框。 B)浏览器编码 在向服务器端提交请求时,浏览器需要将大量的数据一同提交给 Server 端, 而提交前,浏览器需要按照 Server 端可以识别的方式进行编码,对于普通的表单数据,这种编码方式很简单,编码后的结果通常是 field1=value2&field2=value2&… 的形式,如 name=aaaa&Submit=Submit。这种编码的具体规则可以在 rfc2231 里查到, 通常使用的表单也是采用这种方式编码的,Servlet 的 API 提供了对这种 编码方式解码的支持,只需要调用 ServletRequest 类中的方法就可以得到 用户表单中的字段和数据。 这种编码方式( application/x-www-form-urlencoded )虽然简单,但对于传输大块的二进制数据显得力不从心,对于传输这类数据,浏览器采用了另一种编码方式,即 "multipart/form-data" 的编码方式,采用这种方式,浏览器可以很容易的表单内的数据和文件一起。这种编码方式先定义好一个不可能在数据中出现的字符串作为分界符,然后用它将各个数据段分开,而对于每个数据段都对应着 HTML 页面表单中的一个 Input 区,包括一个 content-disposition 属性,说明了这个数据段的一些信息,如果这个数据段的内容是一个文件,还会有 Content-Type 属性,然后就是数据本身。 这里,我们可以编写一个简单的 Servlet 来看到浏览器到底是怎样编码的。 实现流程: 重载 HttpServlet 中的 doPost 方法 调用 request.getContentLength() 得到 Content-Length ,并定义一个与 Content-Length 大小相等的字节数组 buffer 。 从HttpServletRequest 的实例 request 中得到一个 InputStream, 并把它读入 buffer 中。 使用 FileOutputStream 将 buffer 写入指定文件。 代码清单 // ReceiveServlet.java import java.io.*; import javax.servlet.*; import javax.servlet.http.*; //示例程序:记录下Form提交上来的数据,并存储到Log文件中 public class ReceiveServlet extends HttpServlet { public void doPost(HttpServletRequest request,HttpServletResponse response) throws IOException, ServletException { //1 int len = request.getContentLength(); byte buffer[] = new byte[len]; //2 InputStream in = request.getInputStream(); int total = 0; int once = 0;

18,356

社区成员

发帖
与我相关
我的任务
社区描述
VC/MFC 网络编程
c++c语言开发语言 技术论坛(原bbs)
社区管理员
  • 网络编程
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧