ne olacak? Veri setimdeki verinin çeşitliliği (cardinality) hangi alanlarda, ne kadar farklılık yaratacak? Tüm verimin hangi alanlarına, ne sıklıkla erişeceğim? Sık erişilen verilerimin tahmini boyutu nedir? Veritabanımı konumlandıracağım sunucuların kaynakları (özellikle disk ve memory - RAM) nedir?