Seol mar théacs é seo: Object level grouping for video shots