htmlpurifier

mirror of https://github.com/ezyang/htmlpurifier.git synced 2024-12-23 00:41:52 +00:00

Author	SHA1	Message	Date
Edward Z. Yang	6f389f0f25	Release 4.6.0. Signed-off-by: Edward Z. Yang <ezyang@cs.stanford.edu>	2013-11-30 00:25:19 -08:00
Edward Z. Yang	0beecad78a	Add Twitter handle to release notes. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2013-11-29 22:26:57 -08:00
Edward Z. Yang	54477c172b	Fix infinite loop in Lexer. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2013-10-27 21:41:08 -07:00
Edward Z. Yang	0767bbc12d	Rewrite FixNesting implementation to be tree-based. This mega-patch rips out the FixNesting implementation and the related ChildDef components. The primary algorithmic change is to convert from use of tokens to tree nodes, which are far more amenable to the style of processing that FixNesting uses. Additionally, FixNesting has been changed to go bottom-up rather than top-down, in order to avoid needing to implement backtracking. This patch simplifies a good deal of the relevant logic, since we no longer need to continually recalculate the nesting structure when processing things. However, the conversion to the alternate format incurs some overhead, so for small inputs these changes are not a win. One possibility to greatly reduce the constant factors here is to switch to entirely using libxml's representation, and never serializing tokens; this would require one to rewrite injectors, however. The iterative post-order traversal in FixNesting is a bit subtle, but we have essentially reified the stack and continuations. We've removed support for %Core.EscapeInvalidChildren. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2013-10-20 22:37:01 -07:00
Edward Z. Yang	412bae13b5	Fix quadratic behavior in DOMLex due to array_shift. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2013-09-17 00:48:42 -07:00
Edward Z. Yang	cf44f399f8	Properly use HMAC for secure munging. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2013-09-13 21:16:50 -07:00
Edward Z. Yang	53c2907706	New directive %Core.AllowHostnameUnderscore Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2013-07-26 21:33:39 -07:00
Edward Z. Yang	0680832d41	Use info_parent_def to get parent information, since it may not be present in info array. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2013-05-21 17:19:59 -07:00
Edward Z. Yang	19360ddb36	Ignore commas and nbsps for linkification. Thanks nAS for contributing. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2013-05-21 16:43:59 -07:00
Edward Z. Yang	6e37ecd1c8	Make URI parsing algorithm more strict. Thanks Michael Gusev <mgusev@sugarcrm.com> for contributing this patch. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2013-04-16 13:56:43 -07:00
Edward Z. Yang	20eff0a3a0	Fix NEWS entry. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2013-02-21 14:08:36 -08:00
Edward Z. Yang	d516e2f8de	Release 4.5.0 Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2013-02-17 16:04:08 -08:00
Edward Z. Yang	631021733b	Add %Core.DisableExcludes directive Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2013-02-17 15:47:38 -08:00
Edward Z. Yang	62d2550e16	Use SHA-1 instead of MD5. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2012-10-27 02:33:22 -07:00
Edward Z. Yang	087145a71b	Blacklist more tags from RemoveEmpty. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2012-10-27 02:32:48 -07:00
Edward Z. Yang	a44187a5c1	Cleanup after data validation. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2012-10-27 02:30:58 -07:00
Edward Z. Yang	3b537365a4	CSS properties page-break-* Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2012-10-11 11:39:52 -07:00
Edward Z. Yang	72db575446	Fix bug with non-lower case color names in HTML. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2012-07-30 10:54:32 -04:00
Edward Z. Yang	d8bb73ce46	Permit underscores in font-families. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2012-07-27 18:28:29 -04:00
Edward Z. Yang	f90372f8ab	More support for white-space. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2012-06-16 17:10:36 -04:00
Edward Z. Yang	f38fca32a9	Don't lower-case components of background. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2012-06-02 11:22:58 -04:00
Edward Z. Yang	5a23004652	Support for inline-block. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2012-05-25 23:55:48 -04:00
Edward Z. Yang	6705140082	Fix in AttrTransform_Nofollow Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2012-05-14 23:07:27 -04:00
Edward Z. Yang	cb7162a995	Use prepend for autoloading on PHP 5.3+ Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2012-05-02 11:07:24 -04:00
Edward Z. Yang	7291f19347	Fix problem where stacked AttrTransforms clobber each other. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2012-03-16 23:12:16 -04:00
Edward Z. Yang	7291a9647e	Update NEWS. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2012-01-25 07:06:30 -05:00
Edward Z. Yang	17af0e4fc1	Release 4.4.0 Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2012-01-18 19:22:31 -05:00
Edward Z. Yang	1c7fedff5a	Tighter CSS selector validation. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2012-01-17 15:36:26 -05:00
Edward Z. Yang	974fe3f25e	Optional support for IDNAs with PEAR Net_IDNA2 Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2012-01-06 05:28:00 -08:00
Edward Z. Yang	94468f3c24	Remove PEARSax3 lexer. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2012-01-03 20:40:17 +08:00
Edward Z. Yang	e0354fecd9	Make forms work for transitional doctypes. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2011-12-30 22:56:44 +08:00
Edward Z. Yang	5c9b5130c8	Bump minor version number to 4.4.0. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2011-12-26 21:55:14 +08:00
Bradley M. Froehle	4164b2eb2b	Implement Iframe module, and provide %HTML.SafeIframe and %URI.SafeIframeRegexp for untrusted usage. The purpose of this addition is twofold. In trusted mode, iframes are now unconditionally allowed. However, many online video providers (YouTube, Vimeo) and other web applications (Google Maps, Google Calendar, etc) provide embed code in iframe format, which is useful functionality in untrusted mode. You can specify iframes as trusted elements with %HTML.SafeIframe; however, you need to additionally specify a whitelist mechanism such as %URI.SafeIframeRegexp to say what iframe embeds are OK (by default everything is rejected). Note: As iframes are invalid in strict doctypes, you will not be able to use them there. We also added an always_load parameter to URIFilters in order to support the strange nature of the SafeIframe URIFilter (it always needs to be loaded, due to the inability of accessing the %HTML.SafeIframe directive to see if it's needed!) We expect this URIFilter can expand in the future to offer more complex validation mechanisms. Signed-off-by: Bradley M. Froehle <brad.froehle@gmail.com> Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2011-12-26 21:50:53 +08:00
Edward Z. Yang	1e5293d9fe	Add more attributions. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2011-12-26 15:45:41 +08:00
Edward Z. Yang	6b643ede02	Implement %HTML.AllowedComments and %HTML.AllowedCommentsRegexp Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2011-12-26 15:34:42 +08:00
Edward Z. Yang	e41af46a8b	Fix broken table content model, easily seen in XHTML1.1 Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2011-12-26 14:49:26 +08:00
Edward Z. Yang	3570c9985a	Properly handle nested sublists by folding into previous list item. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2011-12-26 14:00:34 +08:00
Edward Z. Yang	8d572993b4	Implement %HTML.TargetBlank Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2011-12-26 08:36:00 +08:00
Edward Z. Yang	9b10515fa4	Core.EscapeNonASCIICharacters now always works, even if target is UTF-8. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2011-12-25 23:31:15 +08:00
Edward Z. Yang	1255d0f15d	Add support for scope attribute on td and th. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2011-12-25 23:31:13 +08:00
Edward Z. Yang	94c15d1f56	Fix iconv truncation bug. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2011-12-25 02:31:06 -05:00
Edward Z. Yang	9f5f85952b	Don't unset parser variable; plays poorly with serialize. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2011-12-18 13:27:51 -05:00
Edward Z. Yang	32c0ffde0c	Don't add nofollow for matching hosts, generalize this code. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2011-08-24 09:56:49 -04:00
Edward Z. Yang	820d6e9097	Do not duplicate nofollow attribute in transform. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2011-08-24 09:56:13 -04:00
Edward Z. Yang	35b1fbce01	Explicitly initialize anonModule to null. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2011-04-19 22:46:17 +01:00
Edward Z. Yang	bcfbb8338c	URI.Munge munges https to http URIs. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2011-04-10 13:09:24 +01:00
Edward Z. Yang	f51a6f7de9	Color keywords now case-insensitive. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2011-04-10 12:45:02 +01:00
Edward Z. Yang	f1439f0af5	Release 4.3.0 Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2011-03-27 23:02:49 +01:00
Edward Z. Yang	0124605918	Fix CSS URL innerHTML/cssText escaping bug. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2011-03-27 21:24:32 +01:00
Edward Z. Yang	afb007d22f	Protect against font family innerHTML/cssText attacks. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2011-03-27 20:35:43 +01:00
Edward Z. Yang	0dd9e4faf4	Fix Internet Explorer innerHTML bug. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2011-03-27 11:50:52 +01:00
Edward Z. Yang	94ed3b1231	Implement CSS.AllowedFonts. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2011-03-24 22:54:39 +00:00
Edward Z. Yang	6a6c0ed5d7	Don't autoclose if no parents support the tag. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2011-03-22 00:26:41 +00:00
Edward Z. Yang	ee9c70ab7f	Fix E_NOTICE from indexing into empty string. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2011-03-17 17:33:11 +00:00
Edward Z. Yang	b4469f17aa	Fix missing numeric entities (shows up when DirectLexing). Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2011-02-27 11:58:37 +00:00
Edward Z. Yang	e76f4b45d0	Dramatically rewrite null host URI handling. Basically, browsers don't parse what should be valid URIs correctly, so we have to go through some backbends to accomodate them. Specifically, for browseable URIs, the following URIs have unintended behavior: - ///example.com - http:/example.com - http:///example.com Furthermore, if the path begins with //, modifying these URLs must be done with care, as if you remove the host-name component, the parse tree changes. I've modified the engine to follow correct URI semantics as much as possible while outputting browser compatible code, and invalidate the URI in cases where we can't deal. There has been a refactoring of URIScheme so that this important check is always performed, introducing a new member variable allow_empty_host which is true on data, file, mailto and news schemes. This also fixes bypass bugs on URI.Munge. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2011-01-25 18:56:46 +00:00
Edward Z. Yang	a32d5b52e1	Fix embedding flash on non-IE browsers and allow more wmode. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2011-01-22 12:28:57 +00:00
Maxim Krizhanovsky	a3d71fe606	Iterative traversal of DOM. There are some deep DOMs you can hit the maximum nesting level limit in tokenizeDOM (we've experienced this even with maximum nesting level of 300). Here is an iterative version of the same function with simple queue/dequeue approach. Signed-off-by: Maxim Krizhanovsky <darhazer@gmail.com>	2011-01-19 22:06:40 +00:00
Petr Skoda	78c4e62245	Add new Cache.SerializerPermissions option.	2011-01-13 22:57:40 +00:00
Edward Z. Yang	b63569ac22	Fix bad interaction between bootstrap autoloader and Zend Debugger/APC. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2010-12-31 09:48:28 +00:00
Edward Z. Yang	f3d050c517	Fix two bugs with caching of customized raw definitions. The first bug is that we will repeatedly write out the result of a customized raw definition to the filesystem, even when a cache entry already exists. The second bug is that caching these definitions doesn't actually work (the cache entry is written but never used.) A new API for retrieving raw definitions permits the user to take advantage of caching. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2010-12-30 23:51:53 +00:00
Edward Z. Yang	cfc4ee1faf	Add initial implementation of CSS.Trusted. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2010-11-12 18:45:03 +00:00
Edward Z. Yang	598c5b60c9	Add sanity check against ze1_compatibility_mode. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2010-11-12 16:15:03 +00:00
Edward Z. Yang	feeffe6ed2	Check if schema.ser was corrupted. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2010-10-29 14:47:40 +01:00
Edward Z. Yang	4754d407aa	Fix removal of id with DirectLex by preserving armor. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2010-10-28 17:25:31 +01:00
Nick Pope	0b9db1f54b	Allow non-static autoload methods w/ PHP >= 5.2.11 HTML Purifier loads itself as the first autoload function by unregistering all existing functions and re-registering them after registering itself. Originally an exception was thrown when a non-static object method was encountered as the behaviour of spl_autoload_functions() did not return the object instance, but only the class name. This was filed on PHP bugs (#44144). The bug was fixed for PHP >= 5.2.11 and >= 5.3 Signed-off-by: Nick Pope <nick@nickpope.me.uk> Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2010-10-28 17:25:17 +01:00
Edward Z. Yang	1d4a38d055	Escape CDATA before handling conditional comments. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2010-09-28 12:11:26 -04:00
Edward Z. Yang	8c80349f9d	Implement HTML.Nofollow for external links. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2010-09-28 12:01:57 -04:00
Edward Z. Yang	d848c99b74	Make IE conditional comment matching ungreedy. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2010-09-28 10:22:38 -04:00
Edward Z. Yang	882ffed9ba	Release 4.2.0. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2010-09-15 02:52:57 -04:00
Edward Z. Yang	86990a21f1	Rename newline normalization directive to something better. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2010-09-15 02:50:39 -04:00
Edward Z. Yang	632bf2bbd4	Shift to 4.2.0 release cycle. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2010-09-14 23:38:51 -04:00
Edward Z. Yang	ec86598446	Add support for file:// URI scheme. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2010-09-09 00:01:26 -04:00
Edward Z. Yang	7c91104532	Implement HTML.FlashAllowFullScreen. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2010-09-08 23:39:20 -04:00
Edward Z. Yang	eac628f490	Add %CSS.ForbiddenProperties directive. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2010-09-04 02:59:03 -04:00
Edward Z. Yang	92913bc816	Add documentation about configuration directive types. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2010-09-04 02:28:53 -04:00
Edward Z. Yang	479d793562	Reword documentation to be clearer, and give warning on common user error. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2010-09-04 01:31:20 -04:00
Edward Z. Yang	e2c15f1c98	Fix Mac Snow Leopard APC bug. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2010-08-26 21:40:58 -07:00
Edward Z. Yang	c04a441b3e	Actually make URI.DisableResources do something. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2010-06-30 05:59:17 -07:00
Edward Z. Yang	1bed8b6d5f	Added %Core.RemoveProcessingInstructions. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2010-06-20 18:26:44 -07:00
Edward Z. Yang	33afd7d9e0	Fix improper handling of IE conditional comments. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2010-06-18 06:08:54 -07:00
Edward Z. Yang	18e538317a	Release 4.1.1. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2010-05-31 20:17:31 -07:00
Edward Z. Yang	96a4193fc9	Fix undefined index warnings in maintenance scripts. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2010-05-31 20:07:27 -07:00
Edward Z. Yang	00c66fa9cb	Fix bug in parsing single attribute with entities. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2010-05-31 19:44:18 -07:00
Edward Z. Yang	d3abcb90e3	Rewrite CSS url() and font-family output logic. The new logic is as follows: * Given a URL to insert into url(), check that it is properly URL encoded (in particular, a doublequote and backslash never occurs within it) and then place it as url("http://example.com"). * Given a font name, if it is strictly alphanumeric, it is safe to omit quotes. Otherwise, wrap in double quotes and replace '"' with '\22 ' (note trailing space) and '\' with '\5C ' (ditto). We introduce expandCSSEscape() which is a hack for common parsing idioms in CSS; this means that CSS escapes are now recognized inside URLs as well as unquoted font names. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2010-05-31 18:45:21 -07:00
Edward Z. Yang	df3100b1b3	Make test script less chatty when log_errors is on. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2010-05-20 21:50:44 -04:00
Edward Z. Yang	143e1ad718	Remove shebang and +x from test script. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2010-05-20 21:21:26 -04:00
Edward Z. Yang	875b0febde	Fix infinite loop involving wrapping formedness. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2010-05-17 23:22:51 -04:00
Edward Z. Yang	3166b8a10f	Fix bug in background-position with center keyword. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2010-05-05 15:08:57 -04:00
Edward Z. Yang	1a70bffd5a	Emit errors when body is extracted. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2010-05-04 13:41:09 -04:00
Edward Z. Yang	f4c6e10ff7	Release 4.1.0. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2010-04-26 18:31:40 -04:00
Edward Z. Yang	da94d3d6ac	Always quote the contents of url() in CSS. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2010-04-26 12:10:15 -04:00
Edward Z. Yang	8ef4fb22db	Support for flashvars in HTML.SafeEmbed. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2010-03-30 13:33:13 -04:00
Edward Z. Yang	70a7a3f5dd	Handle <ol><ol> properly by adding missing <li> tag. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2010-03-10 00:58:37 -05:00
Edward Z. Yang	0229458f8f	Implement Internet Explorer compatibility code for embedded content. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2010-03-08 01:56:40 -05:00
Edward Z. Yang	dc90e8e85b	Support flashvars. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2010-03-08 01:16:57 -05:00
Edward Z. Yang	97125ed18b	Implement data URI scheme. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2010-03-07 21:45:39 -05:00
Edward Z. Yang	aea7d02dfe	Support YouTube slideshow embedding. YouTube slideshows contain a /cp/, not a /v/, in their URL; relax the YouTube filter to allow them. Signed-off-by: Nigel McNie <nigel@catalyst.net.nz> Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2010-03-07 18:57:22 -05:00
Edward Z. Yang	5b4e5c983e	Support proprietary height attribute on table. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2009-08-27 20:17:24 -04:00
Edward Z. Yang	2b72d0445f	Add 4.1.0 release NEWS entry. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2009-07-09 21:03:46 -04:00

1 2 3 4 5 ...

556 Commits