htmlpurifier

mirror of https://github.com/ezyang/htmlpurifier.git synced 2025-01-03 05:11:52 +00:00

Author	SHA1	Message	Date
Synchro	25db9e1dd0	Don't use PHP4-style constructors	2016-03-16 17:09:41 -07:00
Edward Z. Yang	92aabf2b23	Fix #76 , linkify includes dots at end of URL. Signed-off-by: Edward Z. Yang <ezyang@cs.stanford.edu>	2016-03-02 02:05:54 -08:00
Edward Z. Yang	aebe1c02a2	Use idn_to_ascii when available. Signed-off-by: Edward Z. Yang <ezyang@cs.stanford.edu>	2016-03-02 01:35:07 -08:00
Edward Z. Yang	913ac6955b	CSS.AllowDuplicates for duplicate properties. Signed-off-by: Edward Z. Yang <ezyang@cs.stanford.edu>	2015-12-20 11:53:54 -08:00
Edward Z. Yang	c67e4c2f7e	All values, including empty, are valid HTML bools. Signed-off-by: Edward Z. Yang <ezyang@cs.stanford.edu>	2015-02-11 16:36:44 -08:00
Edward Z. Yang	0c3e68dd03	Stop using umask to make definition cache. Fixes #32 This is not really the right way to solve the ACL problem, but there isn't really any reason we should be mucking about with the umask. Mucked around with the test case to make it pass, but I think it's probably a bit delicate now. Signed-off-by: Edward Z. Yang <ezyang@cs.stanford.edu>	2014-12-08 18:30:54 -08:00
Edward Z. Yang	cd60294ada	Fix rgb in border attribute with spaces, fixes #30 . Signed-off-by: Edward Z. Yang <ezyang@cs.stanford.edu>	2014-08-31 12:12:38 +01:00
Edward Z. Yang	39d3df1fd7	Add AutoFormat.RemoveEmpty.Predicate, fixes #35 . Signed-off-by: Edward Z. Yang <ezyang@cs.stanford.edu>	2014-08-31 12:12:17 +01:00
Edward Z. Yang	b8704535a3	Update test. Signed-off-by: Edward Z. Yang <ezyang@cs.stanford.edu>	2014-08-31 11:10:11 +01:00
Edward Z. Yang	15d1a3003a	Don't truncate in DOMLex when seeing closing div Signed-off-by: Edward Z. Yang <ezyang@cs.stanford.edu>	2014-08-31 08:50:33 +01:00
Edward Z. Yang	8cd08620dc	Conditionalize hash_hmac tests for 5.0 Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2013-11-29 22:27:01 -08:00
Edward Z. Yang	54477c172b	Fix infinite loop in Lexer. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2013-10-27 21:41:08 -07:00
Edward Z. Yang	0767bbc12d	Rewrite FixNesting implementation to be tree-based. This mega-patch rips out the FixNesting implementation and the related ChildDef components. The primary algorithmic change is to convert from use of tokens to tree nodes, which are far more amenable to the style of processing that FixNesting uses. Additionally, FixNesting has been changed to go bottom-up rather than top-down, in order to avoid needing to implement backtracking. This patch simplifies a good deal of the relevant logic, since we no longer need to continually recalculate the nesting structure when processing things. However, the conversion to the alternate format incurs some overhead, so for small inputs these changes are not a win. One possibility to greatly reduce the constant factors here is to switch to entirely using libxml's representation, and never serializing tokens; this would require one to rewrite injectors, however. The iterative post-order traversal in FixNesting is a bit subtle, but we have essentially reified the stack and continuations. We've removed support for %Core.EscapeInvalidChildren. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2013-10-20 22:37:01 -07:00
Edward Z. Yang	8f401f769e	Use a Zipper to process MakeWellFormed, removing quadratic behavior. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2013-10-13 13:21:02 -07:00
Edward Z. Yang	82bcc62058	Properly handle context variables that are NULL. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2013-10-13 13:21:02 -07:00
Edward Z. Yang	f17490f009	Implementation of a Zipper, for efficient splice. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2013-10-13 01:16:32 -07:00
Edward Z. Yang	a5fc37d8c3	Improve gitignore. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2013-10-13 00:18:11 -07:00
Edward Z. Yang	cf44f399f8	Properly use HMAC for secure munging. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2013-09-13 21:16:50 -07:00
Marcus Bointon	fac747bdbd	PSR-2 reformatting PHPDoc corrections With minor corrections. Signed-off-by: Marcus Bointon <marcus@synchromedia.co.uk> Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2013-08-17 22:27:26 -04:00
Edward Z. Yang	53c2907706	New directive %Core.AllowHostnameUnderscore Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2013-07-26 21:33:39 -07:00
Edward Z. Yang	75bd7abcc7	Make list nesting test more sensitive. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2013-06-06 13:08:13 -07:00
Edward Z. Yang	0680832d41	Use info_parent_def to get parent information, since it may not be present in info array. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2013-05-21 17:19:59 -07:00
Edward Z. Yang	6e37ecd1c8	Make URI parsing algorithm more strict. Thanks Michael Gusev <mgusev@sugarcrm.com> for contributing this patch. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2013-04-16 13:56:43 -07:00
Edward Z. Yang	631021733b	Add %Core.DisableExcludes directive Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2013-02-17 15:47:38 -08:00
Edward Z. Yang	c0ad68108a	Do checks against iconvAvailable because PHP 5.4 has botched iconv support. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2012-10-27 02:27:57 -07:00
Edward Z. Yang	72db575446	Fix bug with non-lower case color names in HTML. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2012-07-30 10:54:32 -04:00
Edward Z. Yang	f38fca32a9	Don't lower-case components of background. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2012-06-02 11:22:58 -04:00
Edward Z. Yang	6705140082	Fix in AttrTransform_Nofollow Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2012-05-14 23:07:27 -04:00
Edward Z. Yang	2189a9430f	Support for safe external scripts via explicit whitelist. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2012-04-27 17:44:49 -04:00
Edward Z. Yang	7291f19347	Fix problem where stacked AttrTransforms clobber each other. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2012-03-16 23:12:16 -04:00
Edward Z. Yang	31dce298ea	Actually make URI.DisableResources do something. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2012-03-02 13:25:00 -05:00
Edward Z. Yang	8c9d461a62	Bugfix: _blank not blank. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2012-02-18 11:28:01 -05:00
Edward Z. Yang	70028f83d6	Make all of the tests work on all PHP versions. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2012-01-18 18:57:13 -05:00
Edward Z. Yang	5c5e3fe79f	Avoid doing stupidly clever reflection tricks that make old PHP versions sad. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2012-01-18 18:21:36 -05:00
Edward Z. Yang	56a26cab14	Modernize some of the testing facilities. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2012-01-18 18:10:16 -05:00
Edward Z. Yang	1c7fedff5a	Tighter CSS selector validation. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2012-01-17 15:36:26 -05:00
Edward Z. Yang	974fe3f25e	Optional support for IDNAs with PEAR Net_IDNA2 Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2012-01-06 05:28:00 -08:00
Edward Z. Yang	94468f3c24	Remove PEARSax3 lexer. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2012-01-03 20:40:17 +08:00
Edward Z. Yang	e0354fecd9	Make forms work for transitional doctypes. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2011-12-30 22:56:44 +08:00
Edward Z. Yang	d2de8d976a	Add test for invalid SafeIframe usage. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2011-12-26 21:52:55 +08:00
Bradley M. Froehle	4164b2eb2b	Implement Iframe module, and provide %HTML.SafeIframe and %URI.SafeIframeRegexp for untrusted usage. The purpose of this addition is twofold. In trusted mode, iframes are now unconditionally allowed. However, many online video providers (YouTube, Vimeo) and other web applications (Google Maps, Google Calendar, etc) provide embed code in iframe format, which is useful functionality in untrusted mode. You can specify iframes as trusted elements with %HTML.SafeIframe; however, you need to additionally specify a whitelist mechanism such as %URI.SafeIframeRegexp to say what iframe embeds are OK (by default everything is rejected). Note: As iframes are invalid in strict doctypes, you will not be able to use them there. We also added an always_load parameter to URIFilters in order to support the strange nature of the SafeIframe URIFilter (it always needs to be loaded, due to the inability of accessing the %HTML.SafeIframe directive to see if it's needed!) We expect this URIFilter can expand in the future to offer more complex validation mechanisms. Signed-off-by: Bradley M. Froehle <brad.froehle@gmail.com> Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2011-12-26 21:50:53 +08:00
Edward Z. Yang	6b643ede02	Implement %HTML.AllowedComments and %HTML.AllowedCommentsRegexp Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2011-12-26 15:34:42 +08:00
Edward Z. Yang	e41af46a8b	Fix broken table content model, easily seen in XHTML1.1 Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2011-12-26 14:49:26 +08:00
Edward Z. Yang	3570c9985a	Properly handle nested sublists by folding into previous list item. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2011-12-26 14:00:34 +08:00
Edward Z. Yang	8d572993b4	Implement %HTML.TargetBlank Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2011-12-26 08:36:00 +08:00
Edward Z. Yang	9b10515fa4	Core.EscapeNonASCIICharacters now always works, even if target is UTF-8. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2011-12-25 23:31:15 +08:00
Edward Z. Yang	d45e11cc6b	Add one more test for SPL autoload defaults. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2011-12-25 02:58:51 -05:00
Edward Z. Yang	94c15d1f56	Fix iconv truncation bug. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2011-12-25 02:31:06 -05:00
Edward Z. Yang	820d6e9097	Do not duplicate nofollow attribute in transform. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2011-08-24 09:56:13 -04:00
Edward Z. Yang	bcfbb8338c	URI.Munge munges https to http URIs. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2011-04-10 13:09:24 +01:00
Edward Z. Yang	0124605918	Fix CSS URL innerHTML/cssText escaping bug. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2011-03-27 21:24:32 +01:00
Edward Z. Yang	afb007d22f	Protect against font family innerHTML/cssText attacks. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2011-03-27 20:35:43 +01:00
Edward Z. Yang	0dd9e4faf4	Fix Internet Explorer innerHTML bug. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2011-03-27 11:50:52 +01:00
Edward Z. Yang	94ed3b1231	Implement CSS.AllowedFonts. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2011-03-24 22:54:39 +00:00
Edward Z. Yang	6a6c0ed5d7	Don't autoclose if no parents support the tag. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2011-03-22 00:26:41 +00:00
Edward Z. Yang	e05b555448	Safety update for nested ul test. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2011-03-21 21:05:23 +00:00
Edward Z. Yang	ee9c70ab7f	Fix E_NOTICE from indexing into empty string. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2011-03-17 17:33:11 +00:00
Edward Z. Yang	e76f4b45d0	Dramatically rewrite null host URI handling. Basically, browsers don't parse what should be valid URIs correctly, so we have to go through some backbends to accomodate them. Specifically, for browseable URIs, the following URIs have unintended behavior: - ///example.com - http:/example.com - http:///example.com Furthermore, if the path begins with //, modifying these URLs must be done with care, as if you remove the host-name component, the parse tree changes. I've modified the engine to follow correct URI semantics as much as possible while outputting browser compatible code, and invalidate the URI in cases where we can't deal. There has been a refactoring of URIScheme so that this important check is always performed, introducing a new member variable allow_empty_host which is true on data, file, mailto and news schemes. This also fixes bypass bugs on URI.Munge. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2011-01-25 18:56:46 +00:00
Edward Z. Yang	a32d5b52e1	Fix embedding flash on non-IE browsers and allow more wmode. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2011-01-22 12:28:57 +00:00
Petr Skoda	78c4e62245	Add new Cache.SerializerPermissions option.	2011-01-13 22:57:40 +00:00
Edward Z. Yang	5803c06765	Check that argv is set before operating on it. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2011-01-13 22:42:47 +00:00
Edward Z. Yang	f3d050c517	Fix two bugs with caching of customized raw definitions. The first bug is that we will repeatedly write out the result of a customized raw definition to the filesystem, even when a cache entry already exists. The second bug is that caching these definitions doesn't actually work (the cache entry is written but never used.) A new API for retrieving raw definitions permits the user to take advantage of caching. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2010-12-30 23:51:53 +00:00
Edward Z. Yang	cfc4ee1faf	Add initial implementation of CSS.Trusted. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2010-11-12 18:45:03 +00:00
Edward Z. Yang	598c5b60c9	Add sanity check against ze1_compatibility_mode. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2010-11-12 16:15:03 +00:00
Edward Z. Yang	c9e7ffc172	Fix incorrect PEARSax3 test assertion. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2010-11-12 16:06:34 +00:00
Edward Z. Yang	4754d407aa	Fix removal of id with DirectLex by preserving armor. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2010-10-28 17:25:31 +01:00
Nick Pope	0b9db1f54b	Allow non-static autoload methods w/ PHP >= 5.2.11 HTML Purifier loads itself as the first autoload function by unregistering all existing functions and re-registering them after registering itself. Originally an exception was thrown when a non-static object method was encountered as the behaviour of spl_autoload_functions() did not return the object instance, but only the class name. This was filed on PHP bugs (#44144). The bug was fixed for PHP >= 5.2.11 and >= 5.3 Signed-off-by: Nick Pope <nick@nickpope.me.uk> Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2010-10-28 17:25:17 +01:00
Edward Z. Yang	8c80349f9d	Implement HTML.Nofollow for external links. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2010-09-28 12:01:57 -04:00
Edward Z. Yang	d848c99b74	Make IE conditional comment matching ungreedy. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2010-09-28 10:22:38 -04:00
Edward Z. Yang	86990a21f1	Rename newline normalization directive to something better. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2010-09-15 02:50:39 -04:00
Tomasz Muras	9573f0933d	Make newline normalization optional.	2010-09-14 23:49:28 -04:00
Edward Z. Yang	ec86598446	Add support for file:// URI scheme. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2010-09-09 00:01:26 -04:00
Edward Z. Yang	7c91104532	Implement HTML.FlashAllowFullScreen. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2010-09-08 23:39:20 -04:00
Edward Z. Yang	eac628f490	Add %CSS.ForbiddenProperties directive. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2010-09-04 02:59:03 -04:00
Edward Z. Yang	479d793562	Reword documentation to be clearer, and give warning on common user error. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2010-09-04 01:31:20 -04:00
Edward Z. Yang	c04a441b3e	Actually make URI.DisableResources do something. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2010-06-30 05:59:17 -07:00
Edward Z. Yang	1bed8b6d5f	Added %Core.RemoveProcessingInstructions. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2010-06-20 18:26:44 -07:00
Edward Z. Yang	33afd7d9e0	Fix improper handling of IE conditional comments. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2010-06-18 06:08:54 -07:00
Edward Z. Yang	00c66fa9cb	Fix bug in parsing single attribute with entities. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2010-05-31 19:44:18 -07:00
Edward Z. Yang	d3abcb90e3	Rewrite CSS url() and font-family output logic. The new logic is as follows: * Given a URL to insert into url(), check that it is properly URL encoded (in particular, a doublequote and backslash never occurs within it) and then place it as url("http://example.com"). * Given a font name, if it is strictly alphanumeric, it is safe to omit quotes. Otherwise, wrap in double quotes and replace '"' with '\22 ' (note trailing space) and '\' with '\5C ' (ditto). We introduce expandCSSEscape() which is a hack for common parsing idioms in CSS; this means that CSS escapes are now recognized inside URLs as well as unquoted font names. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2010-05-31 18:45:21 -07:00
Edward Z. Yang	df3100b1b3	Make test script less chatty when log_errors is on. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2010-05-20 21:50:44 -04:00
Edward Z. Yang	143e1ad718	Remove shebang and +x from test script. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2010-05-20 21:21:26 -04:00
Edward Z. Yang	875b0febde	Fix infinite loop involving wrapping formedness. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2010-05-17 23:22:51 -04:00
Edward Z. Yang	3166b8a10f	Fix bug in background-position with center keyword. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2010-05-05 15:08:57 -04:00
Edward Z. Yang	1a70bffd5a	Emit errors when body is extracted. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2010-05-04 13:41:09 -04:00
Edward Z. Yang	c1cbd9e565	Mute STRICT errors from CSSTidy and don't run PEARSax3 on PHP 5.3. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2010-04-26 18:27:32 -04:00
Edward Z. Yang	da94d3d6ac	Always quote the contents of url() in CSS. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2010-04-26 12:10:15 -04:00
Edward Z. Yang	70a7a3f5dd	Handle <ol><ol> properly by adding missing <li> tag. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2010-03-10 00:58:37 -05:00
Edward Z. Yang	dc90e8e85b	Support flashvars. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2010-03-08 01:16:57 -05:00
Edward Z. Yang	97125ed18b	Implement data URI scheme. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2010-03-07 21:45:39 -05:00
Paul Stone	9a9036c689	Implement auto-formatter that removes empty span tags. Signed-off-by: Paul Stone <patches@pdjs.co.uk> Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2010-03-07 18:59:33 -05:00
Edward Z. Yang	ac18672aba	Fix extant broken PEARSax3 parsing patterns. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2010-02-26 21:14:52 -05:00
Edward Z. Yang	faf28682ad	Manually work around PEARSax3 E_STRICT errors. Previously, my development environment was not running the PEARSax3 tests because my environment was set to E_STRICT error handling, and thus the tests were skipped. Relax this requirement by making the wrapper class E_STRICT safe. This introduces a few failing tests. Also update TODO and add another fresh test. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2010-02-26 20:42:42 -05:00
Edward Z. Yang	e2cd852bcf	Add shebang line to tests index script. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2010-02-15 02:55:43 -05:00
Edward Z. Yang	694583259c	Fix autoparagraph bug with non-inline elements. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2010-02-15 02:55:33 -05:00
Edward Z. Yang	ba9fd175d7	Make extractBody not terminate prematurely on first </body>. Previously, if two </body> tags were present, HTML Purifier would truncate everything after the first </body>. This is not ideal behavior; so HTML Purifier has been changed to match up to the last </body>. Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2009-07-07 22:19:04 -04:00
Edward Z. Yang	4d27906b02	Make %URI.Munge respect %URI.Host (don't munge). %URI.Munge incorrectly munged URIs that pointed to the same host as the current website (it did, however, have the correct behavior for when the munge URL was on the same server). Signed-off-by: Edward Z. Yang <ezyang@mit.edu>	2009-07-06 22:04:51 -04:00
Edward Z. Yang	c7594487a2	Fix inability to totally override content model. Signed-off-by: Edward Z. Yang <edwardzyang@thewritingpot.com>	2009-06-10 18:24:52 -04:00
Edward Z. Yang	733a5ce5c3	Fix allowsElement() bug manifesting in LinkifyTest. Thanks frank farmer for reporting. Signed-off-by: Edward Z. Yang <edwardzyang@thewritingpot.com>	2009-06-10 18:11:34 -04:00
Edward Z. Yang	6e66dc9cad	Add HTMLPurifier_config->serialize() Signed-off-by: Edward Z. Yang <edwardzyang@thewritingpot.com>	2009-05-30 00:25:14 -04:00

1 2 3 4 5 ...

768 Commits