Bug 18501: set the is_refunded flag as internal var
[koha.git] / C4 / TTParser.pm
1 #!/usr/bin/env perl
2
3 # Copyright Tamil 2011
4 #
5 # This file is part of Koha.
6 #
7 # Koha is free software; you can redistribute it and/or modify it
8 # under the terms of the GNU General Public License as published by
9 # the Free Software Foundation; either version 3 of the License, or
10 # (at your option) any later version.
11 #
12 # Koha is distributed in the hope that it will be useful, but
13 # WITHOUT ANY WARRANTY; without even the implied warranty of
14 # MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the
15 # GNU General Public License for more details.
16 #
17 # You should have received a copy of the GNU General Public License
18 # along with Koha; if not, see <http://www.gnu.org/licenses>.
19
20 #simple parser for HTML with Template Toolkit directives. Tokens are put into @tokens and are accesible via next_token and peep_token
21 package C4::TTParser;
22 use base qw(HTML::Parser);
23 use C4::TmplToken;
24 use strict;
25 use warnings;
26
27 #seems to be handled post tokenizer
28 ##hash where key is tag we are interested in and the value is a hash of the attributes we want
29 #my %interesting_tags = (
30 #    img => { alt => 1 },
31 #);
32
33 #tokens found so far (used like a stack)
34 my ( @tokens );
35
36 #shiftnext token or undef
37 sub next_token{
38     return shift @tokens;
39 }
40
41 #unshift token back on @tokens
42 sub unshift_token{
43     my $self = shift;
44     unshift @tokens, shift;
45 }
46
47 #have a peep at next token
48 sub peep_token{
49     return $tokens[0];
50 }
51
52 #wrapper for parse
53 #please use this method INSTEAD of the HTML::Parser->parse_file method (and HTML::Parser->parse)
54 #signature build_tokens( self, filename)
55 sub build_tokens{
56     my ($self, $filename) = @_;
57     $self->{filename} = $filename;
58     $self->handler(start => "start", "self, line, tagname, attr, text"); #signature is start( self, linenumber, tagname, hash of attributes, original text )
59     $self->handler(text => "text", "self, line, text, is_cdata"); #signature is text( self, linenumber, original text, is_cdata )
60     $self->handler(end => "end", "self, line, tag, attr, text"); #signature is end( self, linenumber, tagename, original text )
61     $self->handler(declaration => "declaration", "self, line, text, is_cdata"); # declaration
62     $self->handler(comment => "comment", "self, line, text, is_cdata"); # comments
63     $self->handler(process => "process", "self, line, text, is_cdata"); # processing statement <?...?>
64 #    $self->handler(default => "default", "self, line, text, is_cdata"); # anything else
65     $self->marked_sections(1); #treat anything inside CDATA tags as text, should really make it a C4::TmplTokenType::CDATA
66     $self->unbroken_text(1); #make contiguous whitespace into a single token (can span multiple lines)
67     open(my $fh, "<:encoding(utf8)", $filename) || die "Cannot open $filename ($!)";
68     $self->parse_file($fh);
69     return $self;
70 }
71
72 #handle parsing of text
73 sub text{
74     my $self = shift;
75     my $line = shift;
76     my $work = shift; # original text
77     my $is_cdata = shift;
78     while($work){
79         # if there is a template_toolkit tag
80         if( $work =~ m/\[%.*?%\]/ ){
81             #everything before this tag is text (or possibly CDATA), add a text token to tokens if $`
82             if( $` ){
83                 my $t = C4::TmplToken->new( $`, ($is_cdata? C4::TmplTokenType::CDATA : C4::TmplTokenType::TEXT), $line, $self->{filename} );
84                 push @tokens, $t;
85             }
86
87             #the match itself is a DIRECTIVE $&
88             my $t = C4::TmplToken->new( $&, C4::TmplTokenType::DIRECTIVE, $line, $self->{filename} );
89             push @tokens, $t;
90
91             # put work still to do back into work
92             $work = $' ? $' : 0;
93         } else {
94             # If there is some left over work, treat it as text token
95             my $t = C4::TmplToken->new( $work, ($is_cdata? C4::TmplTokenType::CDATA : C4::TmplTokenType::TEXT), $line, $self->{filename} );
96             
97             push @tokens, $t;
98             last;
99         }
100     }
101 }
102
103 sub declaration {
104     my $self = shift;
105     my $line = shift;
106     my $work = shift; #original text
107     my $is_cdata = shift;
108     my $t = C4::TmplToken->new( $work, ($is_cdata? C4::TmplTokenType::CDATA : C4::TmplTokenType::TEXT), $line, $self->{filename} );
109     push @tokens, $t;  
110 }      
111
112 sub comment {
113     my $self = shift;
114     my $line = shift;
115     my $work = shift; #original text
116     my $is_cdata = shift;
117     my $t = C4::TmplToken->new( $work, ($is_cdata? C4::TmplTokenType::CDATA : C4::TmplTokenType::TEXT), $line, $self->{filename} );
118     push @tokens, $t;  
119 }      
120
121 sub process {
122     my $self = shift;
123     my $line = shift;
124     my $work = shift; #original text
125     my $is_cdata = shift;
126     my $t = C4::TmplToken->new( $work, ($is_cdata? C4::TmplTokenType::CDATA : C4::TmplTokenType::TEXT), $line, $self->{filename} );
127     push @tokens, $t;
128 }
129
130 sub default {
131     my $self = shift;
132     my $line = shift;
133     my $work = shift; #original text
134     my $is_cdata = shift;
135     my $t = C4::TmplToken->new( $work, ($is_cdata? C4::TmplTokenType::CDATA : C4::TmplTokenType::TEXT), $line, $self->{filename} );
136     push @tokens, $t;  
137 }      
138
139
140 #handle opening html tags
141 sub start{
142     my $self = shift;
143     my $line = shift;
144     my $tag = shift;
145     my $hash = shift; #hash of attr/value pairs
146     my $text = shift; #original text
147     my $t = C4::TmplToken->new( $text, C4::TmplTokenType::TAG, $line, $self->{filename});
148     my %attr;
149     # tags seem to be uses in an 'interesting' way elsewhere..
150     for my $key( %$hash ) {
151         next unless defined $hash->{$key};
152         if ($key eq "/"){
153             $attr{+lc($key)} = [ $key, $hash->{$key}, $key."=".$hash->{$key}, 1 ];
154             }
155         else {
156         $attr{+lc($key)} = [ $key, $hash->{$key}, $key."=".$hash->{$key}, 0 ];
157             }
158     }
159     $t->set_attributes( \%attr );
160     push @tokens, $t;
161 }
162
163 #handle closing html tags
164 sub end{
165     my $self = shift;
166     my $line = shift;
167     my $tag = shift;
168     my $hash = shift;
169     my $text = shift;
170     # what format should this be in?
171     my $t = C4::TmplToken->new( $text, C4::TmplTokenType::TAG, $line, $self->{filename} );
172     my %attr;
173     # tags seem to be uses in an 'interesting' way elsewhere..
174     for my $key( %$hash ) {
175         next unless defined $hash->{$key};
176         $attr{+lc($key)} = [ $key, $hash->{$key}, $key."=".$hash->{$key}, 0 ];
177     }
178     $t->set_attributes( \%attr );
179     push @tokens, $t;
180 }
181
182 1;