def main():
- cr = Crawler()
- # cr.test_entry('dedoelen', 'vr 5 mei, 08:00 uur - Abba live', '')
- # cr.test_entry('dedoelen', 'vr 5 mei08:00 uur - Abba live', '')
- print cr.get_regex('para')
- cr.test_entry('para',
- 'donderdag 13 november 2014 19:30 - Wouter Hamel', '')
- cr.test_entry('para', 'zaterdag 27 september 2014 20:30 - A Great Big '
- 'World - Locatie: Tolhuistuin (zaal)', '')
- cr.test_entry('para', 'zaterdag 27 september 2014 20:30 - A Great Big '
- 'World - Locatie: Tolhuistuin (zaal)',
- 'http://wwww.test.nl')
- cr.to_dot('para', 't.dot')
- cr.test_entry(
- 'dedoelen', 'za 16 aug, 20.15 uur - Elvis & More 2014 - René Shuma'
- 'n & Angel-Eye', '<b>Ode aan 60 jaar rock-and-roll door René Shuma'
- 'n & Angel-Eye</b><br />In 1954 werd de song That’s allright mama door'
- ' Elvis Presley, The King of Rock and Roll, opgenomen en uitgebracht. '
- 'Het duo René Shuman & Angel-Eye houdt zijn muziek in ere met hun thea'
- 'tershows, tv-specials en opnamen. Ze trekken met hun showband volle z'
- 'alen met hun Rock and Roll-vertolkingen. En jaarlijks geeft het duo e'
- 'en bijzonder concert op 16 augustus, de sterfdag van Elvis.<br /><br '
- '/>René: ‘Dit jaar zal ons Elvis & More-concert plaatsvinden in de Doe'
- 'len, de grootste klassieke concertzaal van Nederland met een prachtig'
- 'e akoestiek. We willen onze fans trakteren op een energieke en mooie '
- 'show met subliem geluid en comfortabele zitplaatsen. Een hele avond g'
- 'enieten van 60 jaar Rock and Roll-geschiedenis!’<br/><br/><ul><li><a '
- 'target="_blank" href="http://www.elvisandmore.com">www.elvisandmore.c'
- 'om</a></li></ul>')
+ if len(sys.argv) == 5 and sys.argv[1] == 'test':
+ print 'Crawler: {}\nTitle: {}\nSummary: {}'.format(*sys.argv[2:])
+ cr = Crawler()
+ cr.test_entry(*sys.argv[2:])
+ elif len(sys.argv) == 3 and sys.argv[1] == 'run':
+ print 'Crawler: {}'.format(sys.argv[2])
+ cr = Crawler()
+ else:
+ print '{} test crawlername title summary'.format(sys.argv[0])
+ print '{} run crawlername'.format(sys.argv[0])
-
if __name__ == '__main__':
main()