下载百度汉语App
名师好课免费看

disallow

百科释义

报错

Disallow是robots.txt协议中的核心指令,源自英文“拒绝”的衍生含义,用于禁止网络爬虫抓取指定目录或文件。作为搜索引擎蜘蛛的访问控制规则,其通过网站根目录下的文本文件实现权限管理,例如“Disallow: /private/”即阻止访问该路径下的内容。在技术实现中,该指令需与User-agent字段组合使用,支持通配符匹配、文件类型屏蔽及动态链接过滤等多种配置方式,例如禁止抓取后台目录或PNG图片。网站管理员通过差异化路径声明,可实施全站禁止收录、限制特定引擎或保护敏感数据等多层次控制策略。该指令的标准化应用始于1994年制定的robots排除协议(REP),其语法规则与执行逻辑... 查看百科

注:百科释义来自于百度百科,由网友自行编辑。