开启辅助访问 切换到宽版

精易论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

用微信号发送消息登录论坛

新人指南 邀请好友注册 - 我关注人的新帖 教你赚取精币 - 每日签到


求职/招聘- 论坛接单- 开发者大厅

论坛版规 总版规 - 建议/投诉 - 应聘版主 - 精华帖总集 积分说明 - 禁言标准 - 有奖举报

查看: 180951|回复: 11
收起左侧

[已解决] 如何判断一个URL编码是否是UTF8

 关闭 [复制链接]
结帖率:100% (27/27)
发表于 2019-1-31 15:38:14 | 显示全部楼层 |阅读模式   浙江省宁波市
5精币
如何判断一个URL编码是否是UTF8

最佳答案

查看完整内容

https://bbs.125.la/forum.php?mod=viewthread&tid=14250623&mobile=2

回答提醒:如果本帖被关闭无法回复,您有更好的答案帮助楼主解决,请发表至 源码区 可获得加分喔。
友情提醒:本版被采纳的主题可在 申请荣誉值 页面申请荣誉值,获得 1点 荣誉值,荣誉值可兑换荣誉会员、终身vip用户组。
快捷通道:申请荣誉值无答案申请取消悬赏投诉有答案未采纳为最佳
结帖率:100% (11/11)

签到天数: 4 天

发表于 2019-1-31 15:38:15 高大上手机用户 | 显示全部楼层   陕西省渭南市
https://bbs.125.la/forum.php?mod=viewthread&tid=14250623&mobile=2

评分

参与人数 1荣誉 +1 收起 理由
Cand + 1 热心帮助他人,荣誉+1,希望继续努力(*^__^*) 嘻嘻!

查看全部评分

回复

使用道具 举报

结帖率:100% (3/3)

签到天数: 4 天

发表于 2019-1-31 15:42:19 | 显示全部楼层   江苏省苏州市
csdn上帖子:https://blog.csdn.net/sinat_40431164/article/details/80517899
回复

使用道具 举报

结帖率:100% (2/2)

签到天数: 4 天

发表于 2019-1-31 15:54:15 | 显示全部楼层   广东省深圳市
  1. .版本 2

  2. .子程序 是不是UTF8啊, 逻辑型
  3. .参数 bin, 字节集
  4. .局部变量 i, 整数型
  5. .局部变量 _step, 整数型
  6. .局部变量 _size, 整数型

  7. i = 1
  8. _size = 取字节集长度 (bin)
  9. .判断循环首 (i ≤ _size)
  10.     _step = 0
  11.     .判断开始 (位与 (bin [i], 128) = 0)
  12.         _step = 1
  13.     .判断 (位与 (bin [i], 224) = 192)
  14.         .如果真 (i + 1 > _size)
  15.             返回 (假)
  16.         .如果真结束
  17.         .如果真 (位与 (bin [i + 1], 192) ≠ 128)
  18.             返回 (假)
  19.         .如果真结束
  20.         _step = 2
  21.     .判断 (位与 (bin [i], 240) = 224)
  22.         .如果真 (i + 2 > _size)
  23.             返回 (假)
  24.         .如果真结束
  25.         .如果真 (位与 (bin [i + 1], 192) ≠ 128)
  26.             返回 (假)
  27.         .如果真结束
  28.         .如果真 (位与 (bin [i + 2], 192) ≠ 128)
  29.             返回 (假)
  30.         .如果真结束
  31.         _step = 3
  32.     .默认
  33.         返回 (假)
  34.     .判断结束
  35.     i = i + _step
  36. .判断循环尾 ()
  37. .如果真 (i - 1 = _size)
  38.     返回 (真)
  39. .如果真结束
  40. 返回 (假)
复制代码
回复

使用道具 举报

结帖率:99% (67/68)

签到天数: 1 天

发表于 2019-1-31 16:40:09 | 显示全部楼层   福建省宁德市
你打开网页后,右键查看网页源码,一般在前几行的源码中有一行下面这代码:
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />

看到   charset=utf-8  了吗?
回复

使用道具 举报

头像被屏蔽
发表于 2019-1-31 17:03:33 | 显示全部楼层   湖北省襄阳市
转码判断先
回复

使用道具 举报

发表于 2019-1-31 17:09:53 | 显示全部楼层   辽宁省沈阳市
  
子程序名返回值类型公开备 注
decodeURIComponent_逻辑型 真-UTF8;假-GB2312
参数名类 型参考可空数组备 注
URIPtr整数型
URILen整数型
memPtr整数型左移 (URILen + 1, 1)
decLen整数型返回解码缓冲需要的长度
Position逻辑型真-路径解码;假-参数解码,主要是+如何处理
置入代码 ({ 83, 81, 82, 86, 87, 139, 117, 8, 139, 77, 12, 139, 125, 16, 139, 223, 3, 217, 51, 192, 51, 210, 252, 172, 73, 131, 248, 37, 116, 36, 131, 125, 24, 0, 117, 10, 131, 248, 43, 117, 5, 184, 32, 0, 0, 0, 170, 133, 201, 117, 228, 139, 207, 43, 77, 16, 139, 69, 20, 137, 8, 51, 192, 170, 235, 61, 131, 249, 2, 15, 130, 184, 0, 0, 0, 102, 173, 44, 48, 128, 236, 48, 60, 48, 118, 2, 44, 32, 128, 252, 48, 118, 3, 128, 236, 32, 60, 9, 118, 2, 44, 7, 128, 252, 9, 118, 3, 128, 236, 7, 192, 224, 4, 10, 196, 50, 228, 170, 136, 4, 26, 66, 131, 233, 2, 235, 176, 133, 210, 15, 132, 129, 0, 0, 0, 199, 69, 252, 0, 0, 0, 0, 199, 69, 248, 0, 0, 0, 0, 138, 3, 67, 74, 80, 193, 232, 7, 133, 192, 116, 65, 185, 5, 0, 0, 0, 88, 80, 211, 232, 73, 180, 127, 210, 236, 254, 204, 65, 56, 196, 117, 38, 184, 5, 0, 0, 0, 43, 193, 81, 139, 200, 138, 4, 25, 192, 232, 6, 60, 2, 117, 20, 226, 244, 89, 131, 195, 6, 43, 217, 3, 209, 131, 234, 6, 255, 69, 252, 235, 6, 226, 200, 89, 255, 69, 248, 88, 133, 210, 117, 174, 139, 69, 252, 139, 200, 227, 26, 3, 77, 248, 186, 100, 0, 0, 0, 247, 226, 247, 241, 131, 248, 90, 119, 9, 51, 192, 235, 5, 184, 255, 255, 255, 255, 95, 94, 90, 89, 91, 201, 194, 20, 0 })
返回 ()


这是几年前我写来自用的一段,其实可以优化,懒得改了,你试试用吧


补充内容 (2019-1-31 17:11):
前两个参数就是解码文本的指针和长度
memPtr 这个参数是要先申请一个缓冲区,长度至少是 左移 (URILen + 1, 1)
回复

使用道具 举报

结帖率:100% (27/27)
 楼主| 发表于 2019-1-31 21:44:29 | 显示全部楼层   浙江省宁波市
jr21066 发表于 2019-1-31 15:59
https://bbs.125.la/forum.php?mod=viewthread&tid=14250623&mobile=2

判断文本是不是UTF8我知道,但是内容是先url编码了,解码好再判断就失效了

点评

不理解.如果不存在编码问题就不用判断了. 而且可以解码一部分来判断了.不过判断的内容越多就越不容易误判断   陕西省渭南市  发表于 2019-1-31 21:47
回复

使用道具 举报

结帖率:100% (27/27)
 楼主| 发表于 2019-1-31 21:44:56 | 显示全部楼层   浙江省宁波市
fastdao 发表于 2019-1-31 16:40
你打开网页后,右键查看网页源码,一般在前几行的源码中有一行下面这代码:

判断url编码是不是UTF8编码%E5%86%8D%E9%97%AE%E9%97%AE
回复

使用道具 举报

结帖率:100% (27/27)
 楼主| 发表于 2019-1-31 21:50:55 | 显示全部楼层   浙江省宁波市
jr21066 发表于 2019-1-31 15:59
https://bbs.125.la/forum.php?mod=viewthread&tid=14250623&mobile=2

%BE%AB%D2%D7  就比如这个我想url解码,但我不知道他是UTF8还是GB2312

点评

调试输出 (文本_是否UTF8_汇编 (到字节集 (编码_URL解码 (“%BE%AB%D2%D7”, )))) 内容少了误判断很大.不准确.另外命令在模块里有   陕西省渭南市  发表于 2019-1-31 21:54
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则 致发广告者

发布主题 收藏帖子 返回列表

sitemap| 易语言源码| 易语言教程| 易语言论坛| 诚聘英才| 易语言模块| 手机版| 广告投放| 精易论坛
拒绝任何人以任何形式在本论坛发表与中华人民共和国法律相抵触的言论,本站内容均为会员发表,并不代表精易立场!
论坛帖子内容仅用于技术交流学习和研究的目的,严禁用于非法目的,否则造成一切后果自负!如帖子内容侵害到你的权益,请联系我们!
防范网络诈骗,远离网络犯罪 违法和不良信息举报电话0663-3422125,QQ: 800073686,邮箱:800073686@b.qq.com
Powered by Discuz! X3.4 揭阳市揭东区精易科技有限公司 ( 粤ICP备12094385号-1) 粤公网安备 44522102000125 增值电信业务经营许可证 粤B2-20192173

快速回复 返回顶部 返回列表