upate
[bsc-thesis1415.git] / thesis2 / 3.methods.tex
index 812cff0..b02e707 100644 (file)
@@ -165,42 +165,3 @@ the DAWG is still optimal.
                n -> q0[label="SG0"];
        }
 \end{figure}
-
-%\subsection{Process}
-%Proposal was written
-%
-%
-%First html/mail/fax/rss, worst case rss
-%
-%
-%After some research and determining the scope of the project we decided only to
-%do RSS, this because RSS tends to force structure in the data because RSS feeds
-%are often generated by the website and thus reliable and consistent. We found a
-%couple of good RSS feeds.
-%
-%
-%At first the general framework was designed and implemented, no method yet.
-%
-%
-%Started with method for recognizing separators.
-%
-%
-%Found research paper about algorithm that can create directed acyclic graphs
-%from string, although it was designed to compress word lists it can be
-%(mis)used to extract information.
-%
-%
-%Implementation of DAG algorithm found and tied to the program.
-%
-%
-%Command line program ready. Conversation with both supervisors, gui had to be
-%made.
-%
-%Step by step gui created. Web interface as a control center for the crawlers.
-%
-%
-%Gui optimized.
-%
-%
-%Concluded that the program doesn't reach wide audience due to lack of well
-%structured rss feeds.